Ersatzschlüssel

Ersatzschlüssel verbinden die Dimensionstabellen mit der Fakttabelle. Ersatzschlüssel dienen als wichtiges Mittel, um jede Instanz oder Entität innerhalb einer Dimensionstabelle anzugeben.

Gründe für die Verwendung von Ersatzschlüsseln

Datentabellen in verschiedenen OLTP-Quellensystemen können verschiedene Schlüssel für die gleiche Entität verwenden.
Ein einzelner Schlüssel kann auch von verschiedenen Instanzen der gleichen Entität verwendet werden. Dies bedeutet, dass verschiedene Kunden in mehreren OLTP-Systemen mit dem gleichen Schlüssel dargestellt werden können.

Dies kann ein schwerwiegendes Problem bei dem Versuch sein, Informationen aus verschiedenen Quellensystemen zu konsolidieren. Auch für Unternehmen, die versuchen, nach Fusionen und Übernahmen Data-Warehouses zu erstellen bzw. ändern. Bei vorhandenen Systemen, von denen Langzeitdaten bereitgestellt werden, kann ein anderes Gliederungssystem verwendet worden sein als beim aktuellen OLTP-System. Bei Systemen, die getrennt entwickelt wurden, werden möglicherweise nicht die gleichen Schlüssel verwendet oder aber Schlüssel, die zu Konflikten mit Daten in den Systemen anderer Geschäftsbereiche führen. Diese Situation führt nicht unbedingt zu Problemen, wenn jede Abteilung Summendaten getrennt zurückmeldet. Dies kann aber dann der Fall sein, wenn versucht wird, eine unternehmensweite Sicht der Daten zu erhalten

Daraus folgt, dass die natürlichen Primärschlüssel von Quellensystemen nicht als Primärschlüssel von Dimensionen verwendet werden können, weil nicht sichergestellt werden kann, dass die natürlichen Primärschlüssel für jede Instanz eindeutig sind. Ein Ersatzschlüssel gibt jede Entität in der Dimensionstabelle an, unabhängig vom natürlichen Quellenschlüssel. Dies vor allem deshalb, weil durch einen Ersatzschlüssel ein einfacher ganzzahliger Wert für jede neue Entität erstellt wird.

Ersatzschlüssel ermöglichen es, Data-Warehouse-Informationen beizubehalten, wenn sich Dimensionen ändern.
Ersatzschlüssel sind notwendig, um Änderungen in Dimensionstabellenattributen zu verarbeiten.
Natürliche OLTP-Systemschlüssel können sich ändern oder in den Quellendatensystemen wiederverwendet werden.
Manche Systeme verfügen über Wiederverwendungsschlüssel, die zu veralteten Daten oder zu gelöschten Daten gehören. Solche Schlüssel können in Langzeitdaten im Data-Warehouse weiterhin verwendet werden, aber nicht, um verschiedene Entitäten anzugeben.

Der Entwurf, die Implementierung und die Verwaltung von Ersatzschlüsseln liegen in der Verantwortung des Data-Warehouse-Teams. Ersatzschlüssel werden während des Datenkonvertierungsprozesses im Datenaufbereitungsbereich verwaltet.

Leistung von Abfragen verbessern
Die schmalen ganzzahligen Ersatzschlüssel resultieren in einer schlankeren Fakttabelle. Je schlanker die Fakttabelle, desto besser die Leistung.
Ausnahmefälle verarbeiten
Falls Anforderungen ermitteln werden müssen oder keine Anwendung finden, verwenden Sie einen Ersatzschlüssel.
Änderungen oder die Neuausrichtung von Kennzahlen sollten in einer separaten Spalte in der Tabelle geführt werden.
Falls Daten überprüft oder zusammengefasst werden müssen, sollten Sie diese Spalte als Teil des Ersatzschlüsselsverwenden, unabhängig davon, wie oft sie in einer Tabelle vorkommt.

Global eindeutige IDs als Ersatzschlüssel vermeiden

Global eindeutige IDs funktionieren gut in den OLTP-Quellensystemen, sind aber bei Data-Warehouses schwierig zu verwenden. Dies hat zwei Hauptgründe:
  • Global eindeutige IDs belegen ziemlich viel Speicherplatz im Vergleich zu ihren ganzzahligen Gegenstücken. Sie beanspruchen jeweils 16 Byte, während eine Ganzzahl ungefähr 4 Byte beansprucht.
  • Die Indizes für Spalten mit global eindeutigen IDs sind langsamer als die Indizes für ganzzahlige Schlüssel, weil global eindeutige IDs vier Mal so groß sind.

Feedback