Ermitteln Sie die Granularität der einzelnen Fakttabellen und Geschäftsprozesse.
Bei diesem Prozess ermitteln Sie die Fakttabellentypen und die vorläufigen Kandidaten für Dimensionen und Kennzahlen.
Die folgende Liste enthält mehrere Merkmale der Basiseinheitenidentifikation:
- Inhalt der Datensätze angeben
- Wenn Sie die Basiseinheit ermitteln, geben Sie genau an, was ein Fakttabellendatensatz enthält.
Die Basiseinheit vermittelt den Detaillierungsgrad, der den Messwerten der Fakttabelle zugeordnet ist.
Wenn Sie die Basiseinheit ermitteln, legen Sie auch den Detaillierungsgrad fest, den Sie im Dimensionsmodell zur Verfügung stellen möchten.
Werden mehr Details einbezogen, ist der Granularitätsgrad geringer.
Werden weniger Details einbezogen, ist der Granularitätsgrad höher.
- Detaillierungsgrad ermitteln
- Der Detaillierungsgrad, der in einem Sternschema verfügbar ist, wird als Basiseinheit bezeichnet. Jede Fakt- und Dimensionstabelle verfügt über eine eigene Basiseinheit bzw. Granularität.
Jede Tabelle (entweder Fakt- oder Dimensionstabelle) enthält einen bestimmten, ihr zugeordneten Detaillierungsgrad.
Die Basiseinheit des Dimensionsmodells stellt den höchsten Detaillierungsgrad dar, der eingeschlossen wird, wenn die Fakt- und Dimensionstabellen verknüpft werden.
Beispiel: Die Granularität eines Dimensionsmodells, das die Dimensionen Datum, Geschäft und Produkt enthält, ist Produkt, in Geschäft nach Tag verkauft.
- Daten ermitteln
- Jede Zeile enthält den gleichen Datentyp. Beispiel: Jede Zeile könnte den Tagesumsatz nach Geschäft und nach Produkt oder die täglichen Positionen nach Geschäft enthalten.
Basiseinheitendefinitionen können beispielsweise die folgenden Elemente enthalten:
- Eine Position auf dem Kassenbeleg eines Lebensmittelgeschäfts
- Eine monatliche Kurzdarstellung eines Kontoauszugs
- Ein einzelnes an einem Tag gekauftes Flugticket
Den Fakt- und Dimensionstabellen ist eine Granularität zugeordnet.
In der dimensionalen Modellierung bezieht sich Granularität auf den Detaillierungsgrad der in einer Tabelle gespeicherten Daten.
Beispiel: Eine Dimension wie Datum (mit den Hierarchien Jahr und Quartal) weist eine Granularität auf der Quartalsebene auf, enthält aber keine Informationen für einzelne Tage oder Monate.
Alternativ weist eine Datumsdimensionstabelle (mit den Hierarchien Jahr, Quartal und Monat) eine Granularität auf der Monatsebene auf, enthält jedoch keine Informationen auf der Tagesebene.
Sie können verschiedene Datengranularitäten mithilfe mehrerer Fakttabellen (Tages-, Monats- und Jahrestabellen) verarbeiten.
Sie können auch eine einzelne Tabelle mit einem Granularitätsattribut oder einer Spalte, die die Basiseinheit der Tabelle angibt, verwenden.
Speichern Sie jedoch keine Daten mit unterschiedlicher Granularität in der gleichen Fakttabelle.
Metadaten der Basiseinheit ermitteln
Sie erfassen in dieser Phase die folgenden Metadaten:
- Mindestens eine Basiseinheitendefinition für den Geschäftsprozess, den Sie modellieren
- Typ der verwendeten Fakttabelle
- Allgemeine vorläufige Dimensionen und Kennzahlen
Granularität der Fakttabelle festlegen
Die Basiseinheit basiert auf den ermittelten Anforderungen, die in Schritt 1: Anforderungen für Geschäftsprozesse angeben analysiert und dokumentiert wurden. Sammeln Sie Dokumente wie Rechnungen, Belege und Auftragsmemos.
Diese Dokumente enthalten oft Informationen, die Sie zur Definition der Basiseinheit verwenden können.
Diese Dokumente enthalten auch Informationen, mit deren Hilfe Sie die Dimensionen und Kennzahlen für die Dimensionsmodelle ermitteln können.
Die gewählte Basiseinheit bestimmt den Detaillierungsgrad der Informationen, die für das Dimensionsmodell zur Verfügung gestellt werden können.
Die Basiseinheitendefinition stellt die Basis jedes Dimensionsmodells dar.
Sie bestimmt die verfügbare Informationsebene.
In Richtlinien zum Auswählen der Basiseinheitendefinition werden die folgenden Aspekte berücksichtigt:
- Versuchen Sie in der Phase der Zusammenstellung der Geschäftsanforderungen, Dokumente wie Rechnungsformulare, Bestellformulare und Kaufbelege zu sammeln.
Diesen Dokumenten sind in der Regel Transaktionsdaten wie Bestellnummer und Rechnungsnummer zugeordnet.
- Dokumente können oft Hinweise auf die wichtigen Elemente des Geschäfts wie Kunden und Produkte enthalten.
Sie enthalten oft Informationen auf der untersten Ebene, die vom Unternehmen möglicherweise benötigt werden.
- Ein weiterer wichtiger zu berücksichtigender Punkt ist das Datum. Informieren Sie sich darüber, welcher Detaillierungsgrad einem Kunden, Produkt oder Lieferanten zugeordnet ist.
Sind die Informationen in den Quellensystemen auf Tages-, Monats- oder Jahresebene verfügbar?
Mehrere separate Basiseinheiten verarbeiten
Ermitteln Sie, ob dem Geschäftsprozess, für den Sie Ihr Dimensionsmodell entwerfen, mehrere Basiseinheiten zugeordnet sind.
Einem einzelnen Geschäftsprozess können mehrere Basiseinheitendefinitionen zugeordnet sein.
Entwerfen Sie in solchen Fällen separate Fakttabellen mit separaten Basiseinheiten.
Speichern Sie nicht alle Kennzahlen in einer einzelnen Fakttabelle.
Verschiedene Datengranularitäten können mithilfe mehrerer Fakttabellen (z. B. Tages-, Monats- und Jahrestabellen) verarbeitet werden.
Berücksichtigen Sie auch die Datenmenge, den Speicherplatz sowie die Leistungsanforderungen, wenn Sie entscheiden, wie mehrere Granularitäten verarbeitet werden sollen.
- Kriterien für eine oder mehrere Fakttabellen
- Berücksichtigen Sie die folgenden Kriterien, um zu ermitteln, ob eine oder mehrere Fakttabellen verwendet werden sollen:
- Schauen Sie sich die Kennzahlen an. Entscheiden Sie, ob die Kennzahlen in einer Fakttabelle gruppiert oder auf separate Fakttabellen mit unterschiedlichen Basiseinheiten verteilt werden sollen.
- Sind mehrere OLTP-Quellensysteme beteiligt? Jedes Quellensystem ist auf einen bestimmten Zweck ausgelegt.
Wenn zwei Quellensysteme demselben Zweck dienen, konsolidieren Sie sie in einem einzelnen Quellensystem.
Falls die Systeme getrennt bleiben müssen, wird jedes Quellensystem für eine bestimmte Anforderung des Unternehmens verwendet.
Wahrscheinlich sind separate Quellensysteme beteiligt, wenn die Geschäftsprozesse Auftragsverwaltung, Geschäftsbestand oder Warenlagerbestand umfassen.
Verwenden Sie in diesem Fall separate Fakttabellen.
- Ermitteln Sie, ob mehrere, nicht zusammengehörige Geschäftsprozesse beteiligt sind.
Erstellen Sie separate Fakttabellen für nicht zusammengehörige Geschäftsprozesse. Erstellen Sie für einen einzelnen Geschäftsprozess, der unterschiedliche Granularitätsstufen benötigt, separate Fakttabellen zur Verarbeitung dieser Stufen.
- Entspricht eine Dimension nicht der Basiseinheitendefinition, entwerfen Sie eine neue Fakttabelle mit einer eigenen Basiseinheitendefinition.
- Schauen Sie sich die zeitliche Abfolge und die Reihenfolge von Ereignissen an. Sie benötigen möglicherweise separate Prozesse zur Verarbeitung eines einzelnen Ereignisses.
Beispiel: Ein Unternehmen vermarktet sein Produkt.
Kunden bestellen die Produkte. Die Buchhaltungsabteilung erstellt eine Rechnung.
Der Kunde bezahlt die Rechnung. Nach dem Kauf gibt der Kunde möglicherweise einige der Produkte zurück oder schickt sie zur Reparatur ein.
Gilt für manche der Produkte keine Garantie mehr, erfordert dieser Prozess neue Gebühren.
Mehrere Prozesse sind an der Sequenz eines einzelnen Kaufereignisses beteiligt.
Jeder dieser Prozesse arbeitet wahrscheinlich mit einem bestimmten, unterschiedlichen Zeitpunkt.
Jeder dieser Prozesse wird mit einer separaten Fakttabelle verarbeitet.
- Mehrere Granularitäten in einer einzelnen Fakttabelle
- Wenn Sie mehrere Basiseinheiten in einer Fakttabelle verwenden, fügen Sie eine Spalte mit der Bezeichnung Granularitätsattribut hinzu. Diese Spalte gibt die Basiseinheit der Tabelle an.
Sie definiert, ob die Informationen auf Tages-, Wochen-, Monats- oder Jahresebene gespeichert werden.
Anmerkung: Sie können mehrere Basiseinheiten in einer einzelnen Fakttabelle speichern, dieser Ansatz ist jedoch nicht empfehlenswert.
Entwerfen Sie mehrere Fakttabellen und Sternschemata für jede Basiseinheitendefinition.
Typen der zu verwendenden Fakttabellen ermitteln
Ermitteln Sie den Typ der am Entwurf des Dimensionsmodells beteiligten Fakttabelle.
Weitere Informationen zu Fakttabellentypen finden Sie unter
Fakttabellen und -entitäten.
Atomizität der Basiseinheit prüfen
Prüfen Sie die Atomizität (Detaillierungsgrad) der Basiseinheit, um sicherzustellen, dass sie der höchsten Detailebene entspricht.
Bei dieser Entscheidung werden auch die angenommenen zukünftigen Erfordernisse berücksichtigt, um das Potenzial für eine erforderliche Überarbeitung bei sich ändernden Geschäftsanforderungen zu minimieren.
Die Basiseinheit des Dimensionsmodells ist für den Entwurf des Dimensionsmodells wichtig.
Selbst wenn die Geschäftsanforderungen Informationen auf Monats- oder Tagesebene erfordern, stellen Sie diese Informationen auf Tagesebene zur Verfügung.
Falls Dimensionen detaillierter (atomar) sind, kann das Unternehmen detailliertere Informationen abrufen.
Angenommen, eine Datumsdimension umfasst nur ein Jahresattribut.
Da nur ein Attribut vorhanden ist, können Sie keine Informationen auf Quartals-, Monats- oder Tagesebene abfragen.
Wählen Sie zur Maximierung der verfügbaren Optionen eine detaillierte atomare Basiseinheit.
In diesem Beispiel können Sie als Basiseinheit die Tagesebene definieren.
Beispiel: Die Basiseinheit entspricht einem in einem Geschäft verkauften Produkt.
Sie können nicht einem Kunden ein bestimmtes Produkt zuordnen, das gekauft wird, weil nur eine Zeile für ein Produkt vorhanden ist.
Wird das Produkt tausend Mal von tausend verschiedenen Kunden gekauft, kann diese Information nicht ermittelt werden.
Sie können jederzeit spezifischere Basiseinheiten für einen Geschäftsprozess deklarieren, indem Sie Aggregationen der am stärksten atomaren und detailliertesten Daten verwenden.
Wenn jedoch eine spezifischere Basiseinheit ausgewählt wird, ist die Anzahl der Dimensionen begrenzt und kann weniger differenziert sein.
Es ist nicht möglich, detailliertere Informationen aus diesen weniger differenzierten Dimensionen abzurufen, um zu einem höheren Detaillierungsgrad zu gelangen.
Die Granularität bietet die Möglichkeit, bei den wichtigen Fragen im Data-Warehousing einen Kompromiss zu finden:
- Zwischen der Leistung und der Datenmenge (und der zugehörigen Kosten zur Speicherung dieser Daten)
- Zwischen der Möglichkeit zum Zugriff auf Daten auf einer detaillierten Ebene und der Leistung (und der Kosten der Speicherung sowie des Zugriffs auf große Datenmengen)
Die Auswahl des geeigneten Granularitätsgrads wirkt sich signifikant auf die Menge der Daten im Data-Warehouse aus.
Davon kann auch abhängen, ob das Data-Warehouse die Abfrageanforderungen erfüllen kann.
Wenn Sie sich den Plattenspeicherplatz und die Datenmenge anschauen, bietet eine höhere Granularität eine effizientere Möglichkeit zum Speichern von Daten als eine geringere Granularität.
Sie müssen auch den Plattenspeicherplatz für den Index der Daten berücksichtigen.
Durch Verwendung eines Indexes sparen Sie mehr Plattenspeicherplatz.
Berücksichtigen Sie auch die Bearbeitung großer Datenmengen.
Die Datenbearbeitung kann sich auf die Leistung auswirken und dementsprechend mehr Verarbeitungsleistung erfordern.
Bei der Verarbeitung von Daten sind immer Kompromisse erforderlich.
Beispiel: Durch eine höhere Granularität verringert sich die Möglichkeit, unterschiedliche Typen von Abfragen (die Daten auf einer detaillierteren Ebene erfordern) zu beantworten.
Bei Verwendung eines geringen Granularitätsgrads für die Tabelle können Sie beliebige Abfragen unterstützen, die diese Daten verwenden. Dies erfordert dann jedoch mehr Speicherplatz und bedeutet eine geringere Leistung.
Zwar wirkt sich die Granularität nicht auf die Möglichkeit zur Beantwortung einer Abfrage aus, das System benötigt jedoch möglicherweise mehr Ressourcen zur Ausführung der gleichen Abfrage.
Angenommen, Sie haben zwei Tabellen mit unterschiedlichem Granularitätsgrad: eine Tabelle mit Transaktionsdetails und eine Tabelle, in der Konten nach Monat abgerechnet werden.
Zum Erstellen eines monatlichen Kontenberichts können Sie beide Tabellen ohne Abhängigkeit von der Granularität verwenden.
Bei der Abfrage der detaillierten Transaktionstabelle werden jedoch mehr Daten durchsucht, was mit entsprechendem Verarbeitungsaufwand zur Berechnung der Ergebnisse verbunden ist.
Die Tabelle für die monatliche Kontenübersicht erfordert weniger Ressourcen.
Berücksichtigen Sie bei der Festlegung des Granularitätsgrads den Kompromiss zwischen den Kosten der Datenmenge und der Fähigkeit zur Beantwortung von Abfragen.
Allgemeine Dimensionen und Kennzahlen ermitteln
Ermitteln Sie die allgemeinen vorläufigen Dimensionen und Kennzahlen entsprechend der Basiseinheitendefinition.
Es wird keine detaillierte Analyse durchgeführt, um diese vorläufigen Dimensionen und Kennzahlen zu ermitteln.
Bei der Definition der geeigneten Basiseinheit können Sie die vorläufigen Dimensionen und Kennzahlen einfach feststellen.
Vorläufe Kennzahlen stellen Werte dar, die anhand der Basiseinheitendefinition einfach ermittelt werden können.
Beispiel: Werte wie Stückpreis, Menge und Rabatt können anhand der Basiseinheit ohne großen Aufwand ermittelt werden.
Detaillierte Werte wie Kosten, Fertigungspreis und Transportkosten stellen keine vorläufigen Kennzahlen dar, die durch die Basiseinheit angegeben werden.
Diese Kennzahltypen sind verdeckt und üblicherweise nie in einem Bericht sichtbar.
Vorläufige Kennzahlen entsprechen nicht der endgültigen Gruppe von Kennzahlen.
Die formale Ermittlung der detaillierten Kennzahlen erfolgt, wenn Sie die Kennzahlen ermitteln.
Die vorläufigen Dimensionen und Kennzahlen sind bei der formalen Ermittlung der Dimensionen nützlich.
Bericht zur Phase der Basiseinheitenermittlung erstellen
Für diese Phase wird der Basiseinheitendefinitionsbericht erstellt.
Der Bericht enthält mindestens eine Definition für die Basiseinheit des Geschäftsprozesses und definiert den Typ der Fakttabelle.
Er enthält auch die allgemeinen vorläufigen Dimensionen und Kennzahlen.