Infrastructure préfabriquée d'extraction, de transformation et de chargement IBM Rational Insight

ETL (extraction, transformation et chargement) est un processus de la création d'entrepôts de données qui implique l'extraction de données depuis des sources externes, leur transformation pour les adapter aux besoins métier et finalement leur chargement dans l'entrepôt de données.

Vous pouvez utiliser les fonctions ETL de IBM® Rational Insight (Rational Insight) pour extraire des données de diverses sources, transformer ces données à l'aide de règles métier codées et charger les données transformées dans un magasin de données ciblé. Durant ce processus, des données opérationnelles sont extraites de la source du produit, normalisées, puis mappées à des tables de faits et de dimension. Le composant qui exécute le processus ETL principal est IBM Cognos Data Manager (Data Manager).

Extraction

L'infrastructure préfabriquée ETL extrait des données par un accès directe aux bases de données et via des pilotes ODBC, notamment le pilote ODBC Rational Insight XML. Une organisation stocke ses données dans des bases de données relationnelles traditionnelles ou dans d'autres formats source (comme XML). Puisque Data Manager prend en charge les données dans un format tabulaire, les données entrantes au format XML doivent être converties dans un format relationnel avant le lancement du processus d'extraction ETL principal. Cette opération est réalisée par IBM Rational Insight XML data configuration (XML data configuration), qui mappe des données provenant de sources XML et (à l'aide du pilote ODBC XML), les passe à Data Manager.

Transformation

L'étape suivante consiste à transformer les données à l'aide de règles métier. Cette opération se réalise en deux étapes.
  1. Normalisation des données et modification à l'aide de règles métier. Lors de leur exécution, les règles métier exécutent une logique métier (un calcul ou une dérivation de colonne) en fonction d'autres colonnes.
  2. Stockage des données dans des tables physiques. Ces tables physiques implémentent la convention de schéma en étoile, et ajoute des dimensions et des faits (les éléments des caractéristiques d'un entrepôt de données).

Chargement

La dernière étape consiste à charger ces données transformées dans un magasin de données ciblé, une zone distincte d'un entrepôt de données.

Implémentation

Dans Data Manager, chaque partie d'un processus ETL est une génération de faits ou de dimensions. Vous pouvez organiser les générations dans des flux de travaux pour différents jeux de données ou tables. Les flux de données peuvent être exécutés directement dans Data Manager ou publiés comme une tâche de transfert de données et planifiés ensuite pour une exécution dans IBM Rational Insight Report Server. Les générations ETL principales sont des générations de formulaires normalisés, des générations sans entité, des générations de recherche, des générations de dimension et des générations de faits. Insight implémente et prend en charge des transactions d'échantillon ETL pour des produits comme Rational ClearQuest, Rational ClearCase, Rational RequisitePro, Microsoft® Project, Rational Team Concert, Rational Quality Manager et Rational TestManager.