Obszary przechowywania danych
Hurtownia danych RIDW obejmuje trzy obszary przechowywania danych:
Nazwa tabeli | Przeznaczenie tabeli |
---|---|
SYS_CONFIG | Zawiera informacje o konfiguracji systemu, na przykład typ kalendarza wymiaru danych. |
ETL_INFO | Zawiera informacje konfiguracyjne procesu ETL (wyodrębniania, transformacji i ładowania), takie jak harmonogram procesu ETL (codziennie, raz w tygodniu, raz w miesiącu). |
Dodawane są jeszcze dwie kolumny: ISSOFDELETED i REC_DATETIME.
Klucze odpowiedniki
Klucze odpowiedniki są kluczami podstawowymi utworzonymi podczas procesu ETL. Są one wymagane do przesłonięcia różnic między formatami kluczy podstawowych z różnych źródeł. W każdej wyodrębnionej tabeli hurtownia danych RIDW tworzy własne klucze podstawowe i zachowuje pierwotny klucz w kolumnach EXTERNAL_KEY1 lub EXTERNAL_KEY2. Klucze odpowiedniki są liczbami całkowitymi liczonymi od 0.
Tabele klasyfikacji
Są to tabele reprezentujące powszechnie wykorzystywane artefakty, takie jak projekty, żądania, wymagania, zadania, działania i komponenty. Można je rozpoznać dzięki nazwie, która zawierać słowo “CLASSIFICATION”. Każda tabela klasyfikacji ma wstępnie zdefiniowany typ reprezentujący powszechne zrozumienie artefaktu. Przekształcaniem wyodrębnionych tabel w tabele klasyfikacji zarządza proces ETL.
Rekord pozorny
Wszystkie klasyfikacje i tabele artefaktów zawierają pozorny wiersz, który można zidentyfikować poprzez wartość klucza podstawowego równą -1. Wiersze pozorne obsługują normalizację danych w przypadku wystąpienia wartości pustych dla zdefiniowanych ograniczeń referencyjnych.
Obszar faktów i wymiarów implementuje schemat gwiaździsty, który jest zbiorem faktów, wymiarów i tabel śledzenia historycznego. Tabela faktów zawiera miary lub ‘fakty’ określonego procesu biznesowego. Na przykład, jeśli zarządzanie projektami jest procesem, który ma być mierzony, to odpowiadająca mu tabela faktów może zawierać pewną liczbę wymagań. Tabele wymiarów zawierają atrybuty służące do ograniczania i grupowania danych w zapytaniach służących do opracowywania danych. Jeśli pewna liczba wymagań tworzy tabelę faktów, to typ wymagania może służyć jako wymiar.
Konwencje projektowe
Nazwy tabel wymiarów zaczynają się od ciągu “D_” i mają klucze odpowiedniki identyfikujące rekordy. Nazwy tabel faktów zaczynają się od ciągu “F_”, natomiast tabele zawierające historyczne wglądy w miary znalezione w tabelach faktów zaczynają się od ciągu “H_”. Klucz podstawowy jest zazwyczaj kombinacją klucza odpowiednika miary i klucza odpowiednika artefaktu, na którym opiera się miara. Tabele faktów o nazwach zaczynających się od ciągu “F_C_” są równoważne pierwotnym tabelom faktów trendu, z tą różnicą, że przechowują one tylko najnowszy obraz stanu danych, podczas gdy ich odpowiedniki gromadzą dane, aby umożliwić śledzenie trendu w czasie. Tematyczna hurtownia danych również składa się ze zbioru widoków udostępniających okno do operacyjnej składnicy danych w celu rozszerzania i uwzględnienia większej liczby szczegółów lub list umożliwiających tworzenie raportów.
Kolumny sterujące
Wszystkie tabele faktów mają kolumnę D_DATE odwołującą się do wymiaru daty. Dla tabel trendów data w tym kontekście wskazuje datę wykonania obrazu stanu danych. Dla innych tabel faktów data odzwierciedla wystąpienie zdarzenia, takiego jak utworzenie rekordu. Obraz stanu danych można oznaczyć, aby określić jego tworzenie ‘codziennie’, ‘raz w tygodniu’ lub ‘raz w miesiącu’ w zależności od wartości zapisanej w tabeli SYS_CONFIG w obszarze konfiguracji. Inne kolumny sterujące obejmują kolumnę REC_DATEIME, która służy jako datownik rekordu w przypadku jego wstawienia lub aktualizacji.
Rekord indykatora wartości NULL
Podobnie jak w operacyjnej składnicy danych tabele wymiarów zawierają wiersz indykatora wartości NULL, który można zidentyfikować poprzez wartość klucza podstawowego równą -1. Odpowiada on wartości NULL w tabelach z ograniczeniami.