Pour extraire des données d'une source de données, vous devez connaître la structure des données, créer un catalogue ETL (extraction, transformation et chargement) qui reproduit cette structure dans IBM® Cognos Data Manager, puis configurer le processus requis pour transformer les données en schéma en étoile ou au format de métadonnées requis par le magasin de données ciblé ou IBM Cognos Framework Manager.
Afin de simplifier le processus, IBM Rational Insight dispose d'échantillons de catalogues permettant d'extraire des données des services de données, de charger les données dans le magasin de données opérationnel de IBM Rational Insight data warehouse, et de générer les magasins de données ciblés conformés. Cette section présente l'échantillon de catalogue.
Un catalogue IBM Cognos Data Manager est un référentiel central qui décrit la façon dont des informations seront extraites, transformées et chargées à partir de sources externes. D'une manière générale, un catalogue Data Manager décrit :
- La normalisation et le mappage des données externes dans un schéma relationnel
- La transformation des données à partir des magasins de données opérationnels et leur mappage et insertion dans des tables des faits et de dimensions du magasin de données ciblé.
- Le flux de travaux requis pour organiser la séquence de générations
- Les métadonnées qui décrivent le magasin de données ciblé ou l'entrepôt de données cible
- Les composants communs réutilisables (dimensions, connexions et fonctions définies par l'utilisateur)
L'échantillon de catalogue de
Rational Insight facilite l'extraction, la transformation et le chargement de données issues des produits suivants :
- IBM Rational ClearQuest
- IBM Rational ClearCase
- IBM Rational RequisitePro
- IBM Rational Quality
Manager
- IBM Rational
Team Concert
- IBM Rational Test
Manager
- Microsoft® Project
Ces échantillons de catalogues contiennent des flux de travaux et des générations prédéfinis qui mappent des données extraites de ces sources dans les tables correspondantes et transforment ces tables en faits et dimensions. Tous les échantillons de catalogue contiennent des bibliothèques, des générations et des métadonnées prédéfinis.
Exemple
Considérons la génération d'un échantillon ETL utilisé conjointement avec RequisitePro pour extraire des données de gestion des exigences. La génération charge des données à partir des sources en procédant comme suit :
- Tous les types d'exigence dans la table REQUIREMENT du magasin de données opérationnel
- Informations des types d'exigence dans la table REQUIREMENT_CLASSIFICATION
- Données de révision des exigences dans la table REQUIREMENT_REVISION_HISTORY
- Relation parent-enfant des exigences dans la table REQUIREMENT_REQUIREMENT_LOOKUP
- Données de traçabilité des exigences dans la table REQUIREMENT_HIERARCHY
- Données des projets dans la table PROJECT
- Données utilisateurs dans RESOURCE
Le modèle d'échantillon ETL associé à IBM Rational RequisitePro contient également des flux de travaux prédéfinis ETL qui organisent des travaux dans une catégorie prédéfinie. Un flux de travail est défini pour chacune des sources de données externes. Tous les flux de travaux peuvent être planifiés indépendamment des autres.
Le travail
OOTBE2E est le travail de niveau supérieur qui définit le flux global. Il exécute des travaux de chargement de données dans des tables correspondantes à partir des différentes sources de données opérationnelles externes, puis exécute le travail de génération du magasin de données ciblé dans l'entrepôt de données. Le travail
Build_Star remplit le magasin de données ciblé. Il procède comme suit :
- Démarre le travail Dimensions pour remplir les tables de dimension
- Démarre Facts pour remplir les tables des faits
- Démarre HistoricalLookups pour remplir les tables de consultation historiques.
Vous pouvez personnaliser ces générations et flux de travaux en fonction de votre situation métier spécifique et de l'implémentation de ces produits.