< Précédent | Suivant >

Leçon 2.2 : Personnaliser le catalogue ETL par défaut

Dans cette leçon, vous allez apprendre à personnaliser le catalogue ETL par défaut en créant des dimensions et des tables des faits.

Dans cette leçon, vous allez ajouter un nouveau module de livraison à la génération Data Manager et planifier le module pour exécution.

Dans cette leçon, vous allez :
  • Créer une génération de faits dans Data Manager
  • Créer une cote de référence et une génération de dimension dans Data Manager
  • Ajouter une nouvelle dimension à une génération de faits
  1. Lancez IBM Cognos Data Manager
  2. Sélectionnez Dimensions, cliquez avec le bouton droit de la souris et sélectionnez Insert Reference Dimension. Indiquez Component_LabEx comme étant le nom.
  3. Cliquez avec le bouton droit de la souris sur Component_LabEx, sélectionnez Insert Hierarchy, indiquez Component_LabEx_Dim comme étant le nom, et cliquez sur OK.

    Vous avez ajouté une nouvelle dimension appelée Component_LabEx_Dim.

    Puis, vous allez indiquer l'emplacement à partir duquel il faut extraire les données pour la dimension. Pour cela, vous allez utiliser un modèle et indiquer les colonnes que vous souhaitez charger comme faisant partie de la dimension.

  4. Cliquez avec le bouton droit de la souris sur Component_LabEx_Dim, sélectionnez Insert Level, indiquez Composant comme étant le nom et cliquez sur l'onglet Attributs.
  5. Cliquez sur le bouton Nouveau situé à droite de la zone Modèle, et indiquez Component_LabEx_Dim comme étant le nom.
  6. Cliquez sur l'onglet Attributs et ajoutez les deux définitions d'attribut suivantes :
    • COMPONENT_ID, clé d'entreprise, clé primaire, true
    • NAME, normal
    Cliquez sur OK.
  7. Cliquez sur Level Properties, ajoutez COMPONENT_ID et Nom comme attributs choisis. Cochez la case ID pour l'attribut COMPONENT_ID et la case Caption pour l'attribut Nom.
  8. Cliquez sur Accès aux données, sélectionnez Use Template for data access et spécifiez les valeurs suivantes :
    • Pour Connexion, sélectionnez Rational Data Warehouse.
    • Pour Table name, cliquez sur Parcourir et sélectionnez VEGANF -> COMPONENT.
    Cliquez sur OK.

    L'étape suivante consiste à ajouter une nouvelle génération de dimension.

  9. Développez le noeud VegaETL pour afficher les dimensions sous Builds and JobStreams.
  10. Cliquez avec le bouton droit de la souris sur Dimensions, sélectionnez Insert Dimension Build, entrez D_COMPONENT_LABEX et cliquez sur l'onglet Dimension.
  11. Dans la section Dimension to be delivered, sélectionnez Component_LabEx.
  12. Dans la section Hierarchy/Lookup to be delivered, sélectionnez Component_LabEx_Dim(H).
  13. Dans la section Deliver into database, sélectionnez Rational Data Warehouse. Cliquez sur OK.
  14. Cliquez avec le bouton droit de la souris sur D_COMPONENT_LABEX, sélectionnez Insérer une table, cliquez sur l'icône Table et sélectionnez la table VEGADW > D_COMPONENT_LABEX.
  15. Cliquez sur l'onglet Colonnes. Dans la section Use template, sélectionnez Component_LabEx_Dim.
  16. Dans la section Available Sources, développez le noeud Component_LabEx_Dim > Composant. Faites glisser COMPONENT_ID (ID) dans la colonne Sourced From pour COMPONENT_ID. Faites glisser NAME (Caption) dans la colonne Sourced From pour NAME. Cliquez sur OK.

    Vous avez spécifié la source de données pour la dimension.

    La prochaine étape consiste à ajouter la valeur Component_LabEx_Dim de cette dimension à une génération de faits.

  17. Développez le noeud VegaETL pour afficher les tables sous Builds and JobStreams > Facts.
  18. Sélectionnez Fact, cliquez à l'aide du bouton droit de la souris et sélectionnez Insert Fact Build. Indiquez F_DEFECT_METRICS comme étant le nom de la nouvelle génération et cliquez sur OK.
  19. Cliquez avec le bouton droit de la souris sur le noeud de la génération de faits F_DEFECT_METRICS créé et sélectionnez Propriétés. Accédez à l'onglet Input. Dans la liste Duplicate Key Handling, sélectionnez Merge Records with duplicate keys.
    Remarque : L'option Merge Records with duplicate keys équivaut à la clause GROUP BY dans SQL. Vous utilisez cette option pour rassembler les lignes ; si vous ne le faites pas, le rassemblement ne fonctionne pas au moment de la livraison et le nombre de lignes peut être égal au nombre de lignes d'entrée.
  20. Développez la génération F_DEFECT_METRICS, cliquez avec le bouton droit de la souris sur le noeud Data Stream, puis cliquez sur Insert Data Source. Indiquez Vega_DW comme étant le nom de la nouvelle source de données.
  21. Cliquez sur l'onglet Requête.Dans la liste de bases de données, sélectionnez la connexion Rational Data Warehouse.
  22. Développez le noeud Rational Data Warehouse pour afficher les tables sous le schéma VEGANF et sélectionnez Requête.
    Remarque : Le schéma VEGANF correspond au magasin de données opérationnel.
  23. Dans le panneau Requête, ajoutez le code SQL ci-après :
    SELECT "REQUEST_ID",
    {$ETL_DATEID} AS DATE_ID, COMPONENT_ID
    FROM "VEGANF"."REQUEST"
    WHERE "REQUEST_CLASS_ID"=1 
    Remarque : {$ETL_DATEID} est une variable définie au niveau de la tâche maître et sa valeur est déterminée au niveau supérieur également. La variable désigne un enregistrement dans la dimension D_DATE. Dans ce cas, la date associée dans la table des faits reflète une date de collecte ETL. Reportez-vous aux variables déclarées dans la tâche Build_Star.
  24. Cliquez sur l'onglet Résultats, sélectionnez Prepare et cliquez sur Actualiser. Lorsque vous y êtes invité, entrez la date au format jj/mm/aaaa. Cliquez sur OK.

    Vous avez créé une génération appelée F_DEFECT_METRICS et ajouté le code SQL pour indiquer les enregistrements à extraire de la source de données.

  25. Cliquez avec le bouton droit de la souris sur l'icône DataStream, puis cliquez surPropriétés.
  26. Cliquez sur Automap, puis cliquez sur OK.
  27. Cliquez avec le bouton droit de la souris sur l'icône Transformational Model, puis cliquez sur la boîte de dialogue de mappage.
  28. Cliquez sur Ajouter, sélectionnez Attribut et indiquez DATE_ID comme étant le nom du nouvel attribut.
  29. Cliquez sur Ajouter, sélectionnez Measure et indiquez le nom de la nouvelle mesure comme étant TOTAL_DEFECTS. Cliquez sur la mesure à l'aide du bouton droit de la souris et sélectionnez Propriétés. Dans l'onglet Aggregation, sélectionnez SUM dans la liste. Dans l'onglet Merge, sélectionnez COUNT dans la liste.
  30. Développez la génération de faits F_DEFECT_METRICS, cliquez à l'aide du bouton droit de la souris sur Transformational Model, puis cliquez sur Insert dimension. Dans l'onglet General, spécifiez Component_Dim comme étant le nom. Cliquez sur l'onglet Reference et dans la liste Dimension, sélectionnez Component_LabEx dimension. Dans la liste Structure, sélectionnez la hiérarchie Component_LabEx(H). Cochez la case output. Dans la section Unmatched Member, cochez la case Accept unmatched members.
    Remarque : L'option Accept unmatched members vous permet d'accepter les lignes de l'entrée qui ne correspondent pas à un composant dans D_COMPONENT_LABEX. Vous pouvez alors traiter ces lignes au moment de la livraison (en spécifiant une valeur par défaut si la valeur de la ligne est NULL) ou via les dérivations supplémentaires de la transformation qui possèdent des membres sans occurrences.
  31. Cliquez sur l'icône Transformation Model, développez les noeuds dans la fenêtre de mappage et faites glisser les éléments suivants dans la colonne Maps To :
    • DATE_ID à DATE_ID
    • TOTAL_DEFECTS à REQUEST_ID
    • COMPONENT_ID à Component_LabEx_Dim
    • Component_LabEx à COMPONENT_ID
    Cliquez sur OK.

    Vous avez créé un flux de données pour chaque élément de la source de données. Vous avez mappé l'élément DATE_ID en tant qu'attribut et l'élément TOTAL_DEFECTS en tant que mesure pour qu'ils contiennent le comptage de l'élément d'attribut. L'étape suivante consiste à définir une livraison de faits pour indiquer l'emplacement d'insertion de ces informations dans l'entrepôt de données.

  32. Développez la génération F_DEFECT_METRICS pour afficher les modules de livraison sous Delivery Modules.
  33. Sélectionnez Fact Delivery, cliquez à l'aide du bouton droit de la souris et sélectionnez Insert Relational Table Delivery. Indiquez le nom de la nouvelle génération de faits comme étant VEGADW.F_DEFECT_METRICS.
  34. Dans l'onglet Table Properties, sélectionnez la connexion Rational Data Warehouse, et entrez "VEGADW"."F_REQUEST_METRICS".
  35. Dans la section Colonnes :
    • Mappez DATE_ID à DATE_ID dans la table cible et sélectionnez la colonne Clé.
    • Mappez COMPONENT_ID à COMPONENT_ID dans la table cible et sélectionnez la colonne Clé.
    • Mappez TOTAL_REQUESTS à TOTAL_REQUESTS dans la table cible et sélectionnez la colonne Mettre à jour.
    • Sélectionnez la case (Record Identity) et mappez-la à la colonne DEFECT_METRICS_ID dans la table cible.
    Remarque : L'élément Record Identity figure dans toutes les livraisons de table dans IBM Cognos Data Manager. Il agit en tant que générateur de clés de substitution. Dans ce tutoriel, vous utilisez cet élément pour générer des valeurs pour la clé primaire de la table.
  36. Cliquez sur Import Target Table.
  37. Développez le noeud Rational Data Warehouse pour afficher les tables sous VEGADW et sélectionnez F_DEFECT_METRICS.
  38. Dans la table Module Properties, dans la fenêtre Table Delivery, sélectionnez APPEND comme type d'actualisation. Définissez l'intervalle de validation à 1 000.
    Remarque : Ainsi, la table des faits ajoute toujours des enregistrements à cette table et valide les lignes de la base de données (1 000 lignes à la fois).
  39. Déplacez l'élément DATE_ID vers la colonne DATE_ID, l'élément DEFECT_METRICS_ID vers la colonne (Record Identity) et l'élément TOTAL_DEFECTS vers la colonne TOTAL_DEFECTS.

    Vous avez mappé le module des faits à l'entrepôt de données.

  40. Développez le noeud VegaETL pour afficher les flots de travaux sous Builds and JobStreams > Jobs > StarJobs.
  41. Sélectionnez Facts, cliquez à l'aide du bouton droit de la souris et sélectionnez Insert Node > Fact Build Node. Indiquez F_DEFECT_METRICS comme étant le nom du nouveau noeud.
  42. Dans la section Associated Builds, sélectionnez Facts > Fact > F_DEFECT_METRICS.
  43. Dans l'onglet Predecessor, sélectionnez le noeud Star et cliquez sur OK

    Vous avez inclus le fait F_DEFECT_METRICS à la tâche Star.

    La prochaine étape consiste à créer une cote de référence et une génération de dimension.

  44. Développez le noeud VegaETL pour afficher les générations de faits sous Builds and JobStreams > Facts > Fact > F_DEFECT_METRICS.
  45. Sélectionnez la source de données Vega_DW, cliquez avec le bouton droit de la souris et sélectionnez Propriétés.
  46. Dans la table Requête, ajoutez le code suivant après SELECT "REQUEST_ID",
    "COMPONENT_ID",
  47. Développez le noeud VegaETL pour afficher les tâches sous Builds and JobStreams > Jobs > StarJobs, cliquez à l'aide du bouton droit de la souris sur Dimensions et sélectionnez Insert Node > Dimension Build Node.
  48. Indiquez D_COMPONENT_LABEX comme étant le nom dans la section Générer associée et sélectionnez Dimensions > D_COMPONENT_LABEX.
  49. Dans l'onglet Predecessor, sélectionnez l'onglet Star. Cliquez sur OK.
  50. Republiez la tâche Build_Star en tant que tâche de transfert de données.
Dans cette leçon, vous avez :