< Vorherige Lektion | Nächste Lektion >

Lerneinheit 1.2: Vorhandenen Data Manager-Build ändern

In dieser Lerneinheit erfahren Sie, wie Sie einen vorhandenen Data Manager-Build zum Extrahieren von Daten, zum Konvertieren von Daten und zum Laden von Daten in das Data-Warehouse anpassen können.

Vorbereitungen
Voraussetzungen:
Warum und wann dieser Vorgang ausgeführt wird

In Lerneinheit 1.1 haben Sie die Rational ClearQuest-Datenkonfigurationsdatei geändert und neue Attribute in eine Datentabelle eingefügt. Diese Attribute müssen nun in den Build-Datenstrom übernommen werden, um in Berichten verwendet werden zu können.

In dieser Lerneinheit werden Sie den Data Manager-Build ändern, sodass neue Attribute in den Datenerfassungsprozess übernommen werden. Sie werden lernen, einen vorhandenen Build anzupassen und neue Attribute zu extrahieren. Sie werden außerdem lernen, wie diese Attribute umgewandelt und an das Data-Warehouse übergeben werden.

ETL-Katalog vorbereiten
  1. Starten Sie IBM Cognos Data Manager.
  2. Wählen Sie Create a new catalog aus und geben Sie als Namen RationalInsightETL an. Geben Sie die Verbindungsinformationen zu der vor Beginn dieser Lerneinheit erstellten neuen leeren Datenbank ein und klicken Sie auf Fertig stellen.
  3. Sobald der neue Katalog erstellt und geöffnet ist, klicken Sie auf File > Restore Catalog und wählen Sie die Datei OOTBDMCatalog.ctg aus. Standardposition dieser Datei ist das Verzeichnis [rational_insight_installationsverzeichnis]/datamgr/insight_catalog/.
Neue Attribute aus der Datenquelle extrahieren
  1. Blenden Sie den Ordner Builds and Job Streams > ODS > ClearQuest > CQEnterprise ein. Klicken Sie auf CQ_ENT_Defect.
    Anmerkung: In Data Manager wird ETL in Fakt- oder Dimensionsbuilds angegeben. Ein Faktbuild liefert Faktdaten, kann aber auch Dimensionsdaten liefern. Daher können Sie aus einem einzelnen Build heraus ein privates Datamart konstruieren. Ein Dimensionsbuild liefert Daten zum Beschreiben einer einzelnen Geschäftsdimension wie einem Produkt oder einem Kunden. Rational Insight verwendet Faktbuilds zum Laden von Daten in den konsolidierten Speicher für operative Daten. Fakt- und Dimensionsbuilds werden zum Erstellen der Datamarts oder Sternschemata verwendet. Die Builds werden in Jobströmen als eine Reihe von Schritten angeordnet, die in Data Manager nacheinander oder parallel zueinander ausgeführt werden können.
  2. Klicken Sie doppelt auf das Datenquellensymbol RI_Stg Symbol für Datenquelle. Klicken Sie auf die Registerkarte Query.
    Anmerkung: Bei Verwendung des Datenquellenelements des Builds können Sie eine Untergruppe der für das Build erforderlichen Datenbank auswählen.

    In Lerneinheit 1.1 haben Sie die ClearQuest-Fehlerentität so geändert, dass die dazugehörige Komponenten-ID sowie die Statusattribute offengelegt werden. In den nächsten Schritten werden Sie die Datenquellenabfrage ändern, sodass anschließend die neuen Attribute berücksichtigt werden.

  3. Blenden Sie den Knoten ClearQuest ein, um die Datenbankschemata (modelliert als Ressourcengruppen in "XML Data Configuration") aufzulisten. Blenden Sie das Schema CQEnterprise ein, um alle Datentabellen aufzulisten, die in der Ressourcengruppe CQEnterprise in der Datenkonfigurationsdatei in Lerneinheit 1.1 definiert wurden. Blenden Sie die Tabelle ENTDefect ein, um alle definierten Spalten anzuzeigen.

    Sie werden nun die vorhandene SQL ändern, um die Spalten "component_dbid" und "status" abrufen zu können. Stellen Sie sicher, dass zwischen den Spaltennamen ein Komma gesetzt wird.

  4. Ziehen Sie die Spalten "Status" und "Component_dbid" der Tabelle ENTDefect vom Fenster auf der linken Seite zum Fenster "SQL Query" auf der rechten Seite. Platzieren Sie die neuen Spalten hinter dem bereits vorhandenen Eintrag "href". Stellen Sie sicher, dass zwischen den Spaltennamen zum Trennen ein Komma gesetzt wird.
  5. Klicken Sie zum Testen der neuen SQL-Anweisung auf das Symbol
    Symbol 'Wiedergabe'
    unten links im Fenster. Geben Sie in dem Fenster zur Angabe von Variablen den Schemanamen (CQEnterprise) für den Eintrag $RESOURCEGROUP ein. Lassen Sie das Feld $MODIFIED_SINCE leer, sodass der Nullwert vom Datenservice zur Rückgabe aller Datensätze verwendet werden kann.
  6. Klicken Sie zunächst auf die Registerkarte Result columns und dann auf Refresh. Geben Sie im Fenster zur Angabe von Variablen den Schemanamen (CQEnterprise) für den Eintrag $RESOURCEGROUP ein. Lassen Sie das Feld $MODIFIED_SINCE leer, sodass der Nullwert vom Datenservice zur Rückgabe aller Datensätze verwendet werden kann. Die auf dieser Registerkarte definierten Spalten sind die Spalten aus der in Schritt 7 definierten SQL. Diese Spalten werden in nachgeordneten Objekten verwendet. Klicken Sie auf OK.
  7. Klicken Sie mit der rechten Maustaste auf DataStream und wählen Sie Properties aus. Klicken Sie auf der Registerkarte DataStream items doppelt auf die neuen Spalten im linken Fenster, um diese in den Datenstrom aufzunehmen. Klicken Sie dann auf OK.
    Anmerkung: In einem Objekt des Typs "DataStream" werden alle Datenquellen gebündelt, aus der ein Build oder eine Referenzstruktur Daten erhält. Damit steht eine Methode zur Verfügung, um verschiedene Datenquellen in einem Objekt zu kombinieren. Ein Beispiel ist in den RequisitePro-Builds zu sehen.
Sie haben nun eine neue Spalte zu einem Katalog hinzugefügt und das Konvertierungsmodell entsprechend dieser Änderung aktualisiert.

Nun werden Sie das Attribut "component_dbid" zum Ersatzschlüssel der Komponente im Data-Warehouse transformieren.

Attribute konvertieren
  1. Klicken Sie mit der rechten Maustaste auf das Symbol Transformation Model Symbol für Konvertierungsmodell und öffnen Sie das Zuordnungsfenster.
    Anmerkung: Das Konvertierungsmodell ist zentraler Bestandteil eines Faktbuilds. Das Modell dient der unterschiedlichen Bearbeitung der übernommenen Quellendaten (beispielsweise dem Zusammenführen von Daten aus verschiedenen Quellen und dem Zusammenfassen von Daten). In dieser Lerneinheit werden Sie die neuen Attribute ohne Anwendung von Geschäftsregeln laden.
  2. Klicken Sie doppelt auf den Datenstrom Status.
    Anmerkung: Sie werden nun ein neues Attribut im Konvertierungsmodell erstellen und das Datenstromelement dem Attribut zuordnen.
  3. Klicken Sie zunächst auf Add und dann auf Dimension. Geben Sie als Namen Lookup_Component ein und wählen Sie den untergeordneten Knoten (no reference) aus. Klicken Sie auf die Schaltfläche rechts von diesem Knoten.
  4. Wählen Sie den Knoten Component > Lookup_Component aus und klicken Sie auf OK.
  5. Kehren Sie zum Zuordnungsfenster zurück. Wählen Sie im linken Fenster das Datenstromelement Component_dbid und im rechten Fenster das Attribut Lookup_Component=>EXTERNAL_KEY1 aus und klicken Sie auf Map.
    Anmerkung: In den nächsten Schritten werden Sie die Beziehung zwischen den Fehler- und Komponentenentitäten im Data-Warehouse einrichten. Über EXTERNAL_KEY1 wird der natürliche Schlüssel (dbid für Rational ClearQuest) für die Komponente angegeben. Ist die Komponente im Data-Warehouse vorhanden, wird von der Suchfunktion der Ersatzschlüssel zurückgegeben. Ist der Datensatz nicht vorhanden, wird vom Build der standardmäßige "-1"-Eintrag (steht für "Keine Information verfügbar") eingefügt.
  6. Klicken Sie zunächst auf die Schaltfläche Add und dann auf Attribute. Geben Sie als Namen COMPONENT_ID an und klicken Sie zweimal auf OK.
  7. Klicken Sie mit der rechten Maustaste auf das Symbol Transformation Model Symbol für Konvertierungsmodell und wählen Sie Show Build Elements aus. Klicken Sie doppelt auf Lookup_Component. Klicken Sie dann auf die Registerkarte Unmatched Members und wählen Sie Accept unmatched member identifiers aus. Klicken Sie schließlich auf OK.
  8. Klicken Sie auf der Registerkarte Transformation Model mit der rechten Maustaste auf das Attribut COMPONENT_ID und klicken Sie dann auf Convert to derivation.
  9. Klicken Sie auf der Registerkarte Transformation Model doppelt auf das Attribut COMPONENT_ID. Klicken Sie dann auf die Registerkarte Calculation und geben Sie den folgenden Code ein:
    If NOT Unmatched( Lookup_Component )
    then RETURN Lookup_Component.COMPONENT_ID ;
    else RETURN -1; 
    Klicken Sie auf OK.
    Anmerkung: Zur Angabe einer positiven Zuordnung für diesen Typ von Bedingung wird in dem Script eine doppelt negative Konstruktion verwendet.
Attribute für Zieltabelle bereitstellen
  1. Klicken Sie doppelt auf "{$ODS}"."REQUEST" (Tabellenzustellung).
  2. Geben Sie auf der Registerkarte Table Properties für die Status- und COMPONENT_ID-Elemente als Spaltennamen STATUS and COMPONENT_ID an. Wählen Sie das Kontrollkästchen bei Automatically add columns to table aus. Klicken Sie auf OK.
    Anmerkung: Da Sie die Fehlertabelle im Data-Warehouse nicht dahingehend geändert haben, dass Spalten zur Aufnahme der neuen Attribute vorhanden sind, wird durch Aktivieren der Option Automatically add columns to table veranlasst, dass die Tabelle bei Fehlen der Spalten entsprechend geändert wird. Sie können auch Rational Data Architect verwenden, um die Tabelle vor Ausführen des ETL-Prozesses zu ändern oder um das Datenmodell aus dem Data-Warehouse zu aktualisieren, nachdem die Tabelle durch den ETL-Prozess geändert wurde.
  3. Sichern Sie den Katalog.
Sie haben nun einen vorhandenen Build geändert.
Ergebnisse

Wenn Sie eine neue Entität laden, müssen Sie einen neuen Build erstellen und einen vorhandenen Build entsprechend ändern, um weitere Attribute zu einer vorhandenen Entität hinzufügen zu können. In dieser Lerneinheit haben Sie einen vorhandenen Build geändert. In der nächsten Lerneinheit (1.3) werden Sie einen neuen Build erstellen. Der ETL-Prozess macht einen Build pro Entität erforderlich.

Prüfpunkt zur Lerneinheit

Sie haben ein neues Attribut zum Data Manager-Build hinzugefügt, die Uploadposition des Attributs im Data-Warehouse angegeben und den Data Manager-Build zur Übernahme der Änderungen aktualisiert.


Feedback
< Vorherige Lektion | Nächste Lektion >