Zum Extrahieren der Daten aus einer Datenquelle müssen Sie die Struktur der Daten kennen, einen ETL-Katalog erstellen, der diese Struktur in IBM Cognos Data Manager nachbildet und dann die zum Umsetzen der Daten in das Sternschema oder Metadatenformat erforderlichen Prozesse einrichten, die für das Datamart oder für IBM Cognos Framework Manager erforderlich sind.
IBM Rational Insight verfügt über Musterkataloge zum Extrahieren von Daten aus Datenservices, zum Laden der Daten in den Speicher für operative Daten in IBM Rational Insight-Data-Warehouse und zum Erstellen der konformen Datamarts, um Ihnen dabei zu helfen, den Prozess zu vereinfachen. Dieser Abschnitt bietet eine Übersicht über den Musterkatalog.
Ein IBM Cognos Data Manager-Katalog ist ein zentrales Repository, in dem beschrieben wird, wie Informationen aus externen Quellen extrahiert, umgesetzt und geladen werden. Ein Data Manager-Katalog beschreibt im Allgemeinen Folgendes:
- Die Normalisierung und Zuordnung von externen Daten zu einem relationalen Schema.
- Die Umsetzung von Daten aus Speichern für operative Daten sowie deren Zuordnung und das Einfügen in die Fakt- und Dimensionstabellen des Datamarts.
- Die zum Organisieren der Reihenfolge der Builds erforderlichen Jobströme.
- Die Metadaten, die das vorgegebene Datamart oder das Data-Warehouse beschreiben.
- Die allgemeinen wiederverwendbaren Komponenten (Dimensionen, Verbindungen und benutzerdefinierte Funktionen).
Der Musterkatalog von
Rational Insight erleichtert das Extrahieren, Umsetzen und Laden von Daten aus den folgenden Produkten:
- IBM Rational ClearQuest
- IBM Rational ClearCase
- IBM Rational RequisitePro
- IBM Rational Quality
Manager
- IBM Rational
Team Concert
- IBM Rational Test
Manager
- Microsoft Project
Diese Musterkataloge enthalten vordefinierte Jobströme und Builds, die aus diesen Quellen extrahierte Daten zu den entsprechenden Tabellen zuordnen und diese Tabellen in Fakten oder Dimensionen umsetzen. Jeder Musterkatalog enthält vordefinierte Bibliotheken, Builds und Metadaten.
Beispiel
Denken Sie an den ETL-Musterbuild, der zusammen mit RequisitePro zum Extrahieren von Anforderungsmanagementdaten verwendet wurde. Der Build lädt die Daten wie folgt von der Quelle:
- Alle Anforderungstypen in die Tabelle REQUIREMENT des Speichers für operative Daten.
- Informationen zu den Anforderungstypen in die Tabelle REQUIREMENT_CLASSIFICATION.
- Anforderungsüberarbeitungsdaten in die Tabelle REQUIREMENT_REVISION_HISTORY.
- Anforderung für Beziehung zwischen übergeordnetem und untergeordnetem Element in die Tabelle REQUIREMENT_REQUIREMENT_LOOKUP.
- Rückverfolgbarkeitsdaten für die Anforderung in die Tabelle REQUIREMENT_HIERARCHY.
- Projektdaten in die Tabelle PROJECT.
- Benutzerdaten in RESOURCE.
Das ETL-Mustermodell für IBM Rational RequisitePro enthält auch vordefinierte ETL-Jobströme, die Jobs in vordefinierten Kategorien zusammenfassen. Für jede externe Datenquelle wird ein Jobstrom definiert. Jeder Jobstrom kann unabhängig von den anderen geplant werden.
Der Job
OOTBE2E ist der Job auf höchster Ebene, der den Gesamtfluss definiert. Er führt Jobs zum Laden von Daten aus verschiedenen externen operativen Datenquellen in die entsprechenden Tabellen aus. Dann wird der Job zum Erstellen des Datamarts im Data-Warehouse ausgeführt. Der Job
Build_Star füllt das Datamart. Folgende Schritte werden ausgeführt:
- Der Job Dimensionen wird zum Füllen der Dimensionstabellen gestartet.
- Die Fakten werden zum Füllen der Fakttabellen gestartet.
- HistoricalLookups wird zum Füllen der Tabellen für Langzeitsuchfunktionen gestartet.
Diese Builds und Jobströme können in Abhängigkeit von der bestimmten Geschäftssituation und der Implementierung dieser Produkte angepasst werden.