< Wstecz | Dalej >

Lekcja 2.2: Dostosowanie domyślnego katalogu ETL

Podczas tej lekcji dowiesz się, jak dostosować domyślny katalog ETL, tworząc nowe wymiary i tabele faktów. Dodasz nowy moduł dostarczania do kompilacji menedżera danych i zaplanujesz wykonanie tego modułu.
O tym zadaniu
Podczas tej lekcji:
Utwórz wymiar odniesienia
  1. Uruchom program IBM Cognos Data Manager i załaduj katalog RationalInsightETL.
  2. Rozwiń węzeł Library (Biblioteka).
  3. Kliknij prawym przyciskiem myszy Dimensions (Wymiary) i wybierz opcję Insert Reference Dimension (Wstaw wymiar odniesienia). Podaj nazwę Component_LabEx.
    Wstaw wymiar odniesienia
  4. Prawym przyciskiem myszy kliknij Component_LabEx, wybierz opcję Insert Hierarchy (Wstaw hierarchię), podaj nazwę Component_LabEx_Dim i kliknij przycisk OK.

    Został dodany nowy wymiar o nazwie Component_LabEx_Dim. Za chwilę określisz, gdzie wczytywać dane dla tego wymiaru. W tym celu użyjesz szablonu i określisz kolumny, które mają być załadowane jako część tego wymiaru.

  5. Prawym przyciskiem myszy kliknij Component_LabEx_Dim, wybierz opcję Insert Level (Wstaw poziom), podaj nazwę Component i kliknij zakładkę Attributes (Atrybuty).
  6. Kliknij przycisk New (Nowe) po prawej stronie pola Template (Szablon) i podaj nazwę Component_LabEx_Dim.
  7. Kliknij zakładkę Attributes (Atrybuty) i dodaj dwie następujące definicje atrybutów:
    • COMPONENT_ID, klucz biznesowy, klucz podstawowy, prawda
    • NAME, normalne
    Kliknij przycisk OK.
    Właściwości szablonu
  8. W sekcji Available Attributes (Dostępne atrybuty) dodaj wybrane atrybuty COMPONENT_ID i Name. Zaznacz pole wyboru ID dla atrybutu COMPONENT_ID i Caption (Podpis) dla atrybutu Name.
  9. Kliknij zakładkę Data Access (Dostęp do danych), wybierz opcję Use Template for data access (Użyj szablonu dla dostępu do danych) i podaj następujące wartości:
    • Dla opcji Connection (Połączenie) wybierz Rational Data Warehouse.
    • Dla opcji nazwy tabeli kliknij przycisk Browse (Przeglądaj) i wybierz RIODS -> COMPONENT.
    Kliknij przycisk OK.
Utwórz kompilację wymiaru
  1. Rozwiń węzeł RationalInsightETL, aby wyświetlić wymiary w węźle Builds and JobStreams (Kompilacje i strumienie zadań).
  2. Prawym przyciskiem myszy kliknij Dimensions (Wymiary), wybierz opcję Insert Dimension Build (Wstaw kompilację wymiaru), wpisz D_COMPONENT_LABEX, a następnie kliknij zakładkę Dimension (Wymiar).
  3. W sekcji Dimension to be delivered (Wymiar do dostarczenia) wybierz wybierz Component_LabEx.
  4. W sekcji Hierarchy/Lookup to be delivered (Hierarchia/Wyszukiwanie do dostarczenia) wybierz Component_LabEx_Dim(H).
  5. W sekcji Deliver into database (Dostarcz do bazy danych) wybierz opcję Rational Data Warehouse. Kliknij przycisk OK.
    Właściwości kompilacji wymiaru
  6. Prawym przyciskiem myszy kliknij D_COMPONENT_LABEX, wybierz opcję Insert Table (Wstaw tabelę), kliknij ikonę ikona tabeli i wybierz tabelę RIDW > D_COMPONENT_LABEX.
  7. Kliknij zakładkę Columns (Kolumny). W sekcji Use template (Użyj szablonu) wybierz Component_LabEx_Dim.
  8. W sekcji Available Sources (Dostępne źródła) rozwiń węzeł Component_LabEx_Dim > Component. Przeciągnij i upuść COMPONENT_ID (id) na kolumnę Źródło dla atrybutu COMPONENT_ID. Przeciągnij i upuść NAME (Podpis) na kolumnę Źródło dla atrybutu NAME. Kliknij przycisk OK.
Utwórz kompilację faktów
  1. Rozwiń węzeł RationalInsightETL, aby wyświetlić tabele w węźle Builds and JobStreams (Kompilacje i strumienie zadań) > Facts (Fakty).
  2. Wybierz Fact (Fakt), kliknij prawym przyciskiem myszy, a następnie kliknij opcję Insert Fact Build (Wstaw kompilację faktów). Podaj następującą nazwę nowej kompilacji F_DEFECT_METRICS i kliknij przycisk OK.
  3. Prawym przyciskiem myszy kliknij nowo utworzony węzeł kompilacji faktów F_DEFECT_METRICS i wybierz opcję Properties (Właściwości). Kliknij zakładkę Input (Wejście). Z listy Duplicate Key Handling (Obsługa zduplikowanych kluczy) wybierz opcję Merge Records with duplicate keys (Scal rekordy o zduplikowanych kluczach). Kliknij przycisk OK.
    Właściwości kompilacji faktów
    Pojęcie: Opcja Merge Records with duplicate keys (Scal rekordy o zduplikowanych kluczach) jest odpowiednikiem klauzuli GROUP BY w języku SQL. Używa się jej po to, aby zagregować wiersze; w przeciwnym razie agregacja dla dostarczania nie będzie działała i można uzyskać tyle wierszy, ile jest wierszy wejściowych.
  4. Rozwiń kompilację F_DEFECT_METRICS, prawym przyciskiem myszy kliknij węzeł Data Stream (Strumień danych), a następnie kliknij opcję Insert Data Source (Wstaw źródło danych). Podaj następującą nazwę nowego źródła danych: RI_DW.
  5. Kliknij zakładkę Query (Zapytanie). Z listy baz danych wybierz połączenie Rational Data Warehouse.
  6. Rozwiń węzeł Rational Data Warehouse, aby wyświetlić tabele w schemacie RIODS, i wybierz opcję REQUEST.
    Pojęcie: Schemat RIODS jest operacyjną składnicą danych.
  7. Na panelu Zapytanie dodaj następujący kod SQL:
    SELECT "REQUEST_ID",
    {$ETL_DATEID} AS DATE_ID, COMPONENT_ID
    FROM "RIODS"."REQUEST"
    WHERE "REQUEST_CLASS_ID"=1 
    Kod SQL dla kompilacji faktów
    Pojęcie: {$ETL_DATEID} jest zmienną zdefiniowaną na poziomie zadania głównego, jej wartość jest określana także na poziomie głównym. Ta zmienna wskazuje rekord w wymiarze D_DATE. W takiej sytuacji dane powiązane w tabeli faktów odzwierciedlają datę kolekcji ETL. Patrz: zmienne zadeklarowane w zadaniu Build_Star.
  8. Kliknij zakładkę Result columns (Kolumny wynikowe), wybierz opcję Prepare (Przygotuj) i kliknij Refresh (Odśwież). Podaj liczbę całkowitą ETL_DATEID. Kliknij dwukrotnie przycisk OK.

    Nowa kompilacja o nazwie F_DEFECT_METRICS została utworzona i dodano kod SQL określający rekordy do pobrania ze źródła danych.

  9. Prawym przyciskiem myszy kliknij ikonę DataStream (Strumień danych) i wybierz opcję Properties (Właściwości).
  10. Kliknij opcję Automap (Automatyczne odwzorowanie), a następnie przycisk OK.
  11. Prawym przyciskiem myszy kliknij ikonę Transformational Model (Model transformacji) ikona modelu transformacji i wybierz opcję Mapping (Odwzorowanie).
  12. Kliknij przycisk Add (Dodaj), wybierz opcję Attribute (Atrybut), a następnie podaj następującą nazwę nowego atrybutu: DATE_ID. Kliknij ponownie przycisk Add (Dodaj), wybierz opcję Attribute (Atrybut), a następnie podaj następującą nazwę nowego atrybutu: COMPONENT_ID.
  13. Kliknij przycisk Add (Dodaj), wybierz opcję Measure (Miara), a następnie podaj następującą nazwę nowej miary: TOTAL_DEFECTS. Kliknij dwukrotnie przycisk OK. Prawym przyciskiem myszy kliknij tę miarę, a następnie wybierz opcję Properties (Właściwości). Na karcie Aggregation (Agregacja) z listy wybierz opcję SUM. Na karcie Merge (Scalanie) z listy wybierz opcję COUNT. Kliknij przycisk OK.
    Właściwości miary
  14. Rozwiń kompilację faktów F_DEFECT_METRICS, prawym przyciskiem myszy kliknij >Transformational Model (Model transformacji), a następnie kliknij opcję Insert dimension (Wstaw wymiar). Na karcie General (Ogólne) podaj następującą nazwę: Component_Dim. Kliknij kartę Reference (Odniesienie) i z listy Dimension (Wymiar) wybierz wymiar Component_LabEx. Z listy Structure (Struktura) wybierz hierarchię Component_LabEx(H). Zaznacz pole output (wyjście). Na karcie Unmatched Member (Składnik bez odpowiednika) wybierz pole Accept unmatched member identifiers (Akceptuj identyfikatory składników bez odpowiedników). Kliknij przycisk OK.
    Pojęcie: Opcja Accept unmatched member identifiers (Akceptuj identyfikatory składników bez odpowiedników) powoduje akceptowanie wierszy wejściowych, które nie są zgodne z komponentem w D_COMPONENT_LABEX. Takie wiersze możesz obsłużyć po dostarczeniu (na przykład podając wartość domyślną, jeśli wiersz ma wartość NULL) lub za pomocą kolejnych wyprowadzeń w transformacji, która ma niedopasowane elementy.
  15. Kliknij ikonę Transformation Model (Model transformacji) ikona modelu transformacji, rozwiń węzły w oknie odwzorowania i przeciągnij następujące elementy na kolumnę Maps To (Odwzoruj na):
    • DATE_ID na DATE_ID
    • TOTAL_DEFECTS na REQUEST_ID
    • COMPONENT_ID na COMPONENT_ID
    Kliknij przycisk OK.

    Strumień danych dla każdego elementu źródła danych został utworzony. Element DATE_ID został odwzorowany jako atrybut, a element TOTAL_DEFECTS został odwzorowany jako miara zawierająca licznik elementu atrybutu. W kolejnym kroku zdefiniujesz dostarczenie faktu, aby wskazać miejsce w hurtowni danych, w którym ta informacja zostanie wstawiona.

  16. Rozwiń kompilację F_DEFECT_METRICS, aby wyświetlić moduły dostarczania w sekcji Delivery Modules (Moduły dostarczania).
  17. Wybierz opcję Fact Delivery (Dostarczanie faktów), kliknij prawym przyciskiem myszy, a następnie kliknij opcję Insert Relational Table Delivery (Wstaw tabelę relacyjną). Podaj następującą nazwę nowej kompilacji faktów: RIDW.F_DEFECT_METRICS.
  18. Na karcie Table Properties (Właściwości tabeli) wybierz połączenie Rational Data Warehouse i wpisz "RIDW"."F_DEFECT_METRICS".
  19. W sekcji Columns (Kolumny):
    • Dla elementu DATE_ID zaznacz pole key (klucz).
    • Dla drugiego elementu zaznacz pole update (aktualizuj).
    Sprawdź, czy zaznaczone jest pole Record Identity (Tożsamość rekordu).
  20. Kliknij opcję Import Target Table (Importuj tabelę docelową).
  21. Rozwiń węzeł Rational Data Warehouse, aby wyświetlić tabele w RIDW, i wybierz F_DEFECT_METRICS.
  22. Przeciągnij element DATE_ID na kolumnę DATE_ID, element DEFECT_METRICS_ID na kolumnę Tożsamość rekordu i element TOTAL_DEFECTS na kolumnę TOTAL_DEFECTS. Kliknij przycisk OK.
    Importowanie tabeli docelowej
    Pojęcie: Element Record Identity (Tożsamość rekordu) znajduje się w każdym dostarczeniu tabeli w aplikacji IBM Cognos Data Manager. Element ten działa jako odpowiednik generatora kluczy. W tym kursie używasz tego elementu do wygenerowania wartości dla klucza podstawowego tabeli.
  23. Na karcie Module Properties (Właściwości modułu) w oknie Table Delivery (Dostarczanie tabeli) jako typ odświeżania wybierz APPEND. Ustaw przedział zatwierdzania na 1000.
    Właściwości modułu faktów
    Pojęcie: To oznacza, że ta tabela faktów będzie zawsze dodawała rekordy do tabeli i będzie zatwierdzała wiersze w tabeli w ilości 1000 wierszy jednocześnie.
Dodaj kompilacje do zadania i opublikuj to zadanie
  1. Rozwiń węzeł RationalInsightETL, aby wyświetlić strumienie zadań w Builds and JobStreams (Kompilacje i strumienie zadań) > Jobs (Zadania) > StarJobs.
  2. Wybierz opcję Facts (Fakty), kliknij prawym przyciskiem myszy, a następnie kliknij opcje Insert Node (Wstaw węzeł) > Fact Build Node (Węzeł kompilacji faktów). Podaj następującą nazwę biznesową nowego węzła: F_DEFECT_METRICS.
  3. W sekcji Associated Builds (Powiązane kompilacje) wybierz opcje Facts (Fakty) > Fact (Fakt) > F_DEFECT_METRICS.
  4. Na karcie Predecessor (Poprzednik) wybierz węzeł Start (Uruchom) i kliknij przycisk OK.
  5. Rozwiń węzeł RationalInsightETL, aby wyświetlić zadania w Builds and JobStreams (Kompilacje i strumienie zadań) > Jobs (Zadania) > StarJobs, prawym przyciskiem myszy kliknij Dimensions (Wymiary) i wybierz opcje Insert Node (Wstaw węzeł) > Dimension Build Node (Węzeł kompilacji wymiarów).
  6. Podaj następującą nazwę: D_COMPONENT_LABEX i w sekcji powiązanej kompilacji wybierz opcje Dimensions (Wymiary) > D_COMPONENT_LABEX.
  7. Na karcie Predecessor (Poprzednik) wybierz węzeł Uruchom. Kliknij przycisk OK.
  8. Ponownie opublikuj zadanie Build_Star jako zadanie przeniesienia danych.
    1. Wybierz zadanie Build_Star.
    2. Na pasku menu kliknij Actions (Działania) > Publish Data Movement Task (Publikuj zadanie przeniesienia danych).
    3. Rozwiń gałąź Jobs (Zadania) > Star Jobs wybierz Build_Star i kliknij przycisk OK.

Punkt kontrolny lekcji

W tej lekcji opisano tworzenie wymiarów odniesienia, kompilacji wymiarów i kompilacji faktów oraz dodawanie kompilacji do zadań i publikowanie zadań.

Opinia