Clés de substitution

Les clés de substitution joignent les tables de dimensions à la table de faits. Elles jouent un rôle important dans l'identification de chaque instance ou entité d'une table de dimensions.

Raisons justifiant l'utilisation de clés de substitution

Les tables de données de plusieurs systèmes source OLTP peuvent utiliser des clés différentes pour la même entité.
Il est également possible qu'une seule clé soit utilisée par des instances différentes d'une même entité. Cela signifie que des clients différents peuvent être représentés par la même clé sur différents systèmes OLTP.

Cette configuration peut représenter un problème majeur lorsque vous tentez de regrouper les informations de différents systèmes source ou pour les entreprises qui tentent de créer ou de modifier des entrepôts de données après des fusions et des acquisitions. Les systèmes existants qui fournissent les données d'historique utilisent un système de numérotation différent de celui d'un système OLTP actuel. En outre, des systèmes développés de manière indépendante risquent de ne pas utiliser les mêmes clés ou d'utiliser des clés qui génèrent des conflits avec les données des systèmes d'autres divisions. Cette situation peut ne pas poser de problème lorsque chaque service transmet des données récapitulatives de manière indépendante mais elle peut être problématique lorsque vous tentez d'obtenir une vue globale des données à l'échelle de l'entreprise.

Cela signifie que vous ne pouvez pas vous appuyer sur les clés primaires naturelles du système source car rien ne garantit que celles-ci seront uniques pour chaque instance. Une clé de substitution identifie de manière unique chaque entité de la table de dimensions, quelle que soit sa clé source naturelle. En effet, la clé de substitution génère une valeur de type entier simple pour chaque nouvelle entité.

Les clés de substitution permettent de gérer les informations des entrepôts de données lorsque les dimensions évoluent
Des clés de substitution sont nécessaires pour prendre en charge les modifications apportées aux attributs de la table de dimensions.
Les clés naturelles des systèmes OLTP peut être modifiées ou réutilisées dans des systèmes de données source
Certains systèmes réutilisent des clés associées à des données obsolètes ou supprimées. Toutefois, la clé peut toujours être utilisée dans des données d'historique de l'entrepôt de données et la même clé ne peut pas être utilisée pour identifier différentes entités.

L'équipe chargée des entrepôts de données est responsable de la conception, de la mise en oeuvre et de l'administration de clés de substitution. Les clés de substitution sont conservées dans la zone de préparation des données pendant la procédure de transformation des données.

Améliorer les performances des requêtes
Les clés de substitution avec des entiers faibles génèrent une table de faits plus petite. Une table de faits plus petite offre de meilleures performances.
Traiter les cas d'exception
Si des exigences doivent être identifiées ou qu'elles ne s'appliquent pas, utilisez une clé de substitution.
Les modifications ou le réalignement de mesures doivent être effectués dans une colonne distincte de la table
Si les données doivent être révisées ou récapitulées (quel que soit leur nombre d'apparitions dans une table), vous devez utiliser cette colonne comme clé de substitution.

Utilisation déconseillée des identificateurs globaux uniques comme clés de substitution

Les identificateurs globaux uniques fonctionnent généralement bien dans les systèmes OLTP source mais il sont difficiles à utiliser dans des entrepôts de données. Deux raisons expliquent ces difficultés :
  • Les identificateurs globaux uniques utilisent une quantité d'espace plus importante que les entiers. Ils utilisent chacun 16 octets environ alors qu'un entier utilise 4 octets environ.
  • Les performances des index d'identificateurs globaux uniques sont relativement plus lentes que celles des index de clés d'entier car les identificateurs globaux uniques sont quatre fois plus volumineux.

Commentaires en retour