Para extraer datos de un origen de datos, es necesario conocer la estructura de datos, crear un catálogo de extracción, transformación y carga (ETL) que reproduzca esta estructura en IBM® Cognos Data Manager,
y a continuación, configurar los procesos necesarios para transformar los datos en el esquema de estrella o el formato de metadatos necesario en la despensa de datos o en IBM Cognos Framework Manager.
Para ayudar a simplificar el proceso, IBM Rational Insight contiene catálogos de ejemplo para extraer datos de los servicios de datos, cargarlos en el almacén de datos operativos del Depósito de datos de IBM Rational Insight y crear las despensas de datos conformadas. En esta sección se ofrece una visión general del catálogo de ejemplo.
Un catálogo de IBM Cognos Data Manager es un repositorio central que describe cómo se extraerá, transformará y cargará la información desde los orígenes externos.
En un sentido amplio, un catálogo Data manager describe lo siguiente:
- La normalización y correlación de datos externos en un esquema relacional
- La transformación de datos de los almacenes de datos operativos y su correlación e inserción en las tablas de hechos y dimensiones de la despensa de datos.
- Las secuencias de trabajos necesarias para organizar la secuencia de compilaciones
- Los metadatos que describen la despensa o el almacén de datos de destino
- Los componentes reutilizables comunes (dimensiones, conexiones y funciones definidas por el usuario)
El catálogo de ejemplo de
Rational Insight facilita la extracción, transformación y carga de datos de los siguientes productos:
- IBM Rational ClearQuest
- IBM Rational ClearCase
- IBM Rational RequisitePro
- IBM Rational Quality
Manager
- IBM Rational
Team Concert
- IBM Rational Test
Manager
- Microsoft® Project
Estos catálogos de ejemplo contienen secuencias de trabajos predefinidas y compilaciones que correlacionan los datos extraídos de estos orígenes con las tablas correspondientes, y transforman estas tablas en hechos y dimensiones.
Cada catálogo de ejemplo contiene bibliotecas, compilaciones y metadatos predefinidos.
Ejemplo
Considere la compilación ETL de ejemplo que se utiliza junto con RequisitePro para extraer datos de gestión de requisito. La compilación carga datos desde el origen tal como se indica a continuación:
- Todos los tipos de requisitos en la tabla REQUIREMENT del almacén de datos operativos
- Información de tipos de requisitos en la tabla REQUIREMENT_CLASSIFICATION
- Datos de revisión de requisitos en la tabla REQUIREMENT_REVISION_HISTORY
- Relación padre-hijo de requisito en la tabla REQUIREMENT_REQUIREMENT_LOOKUP
- Datos de rastreabilidad de requisito en la tabla REQUIREMENT_HIERARCHY
- Datos de proyectos en la tabla PROJECT
- Datos de usuarios en RESOURCE
El modelo ETL de ejemplo para IBM Rational RequisitePro también contiene secuencias de trabajos ETL predefinidas que organizan trabajos en una categoría predefinida.
Hay una secuencia de trabajos definida para cada origen de datos externos.
Cada secuencia de trabajos se puede planificar independientemente de las demás.
El trabajo
OOTBE2E es el trabajo de nivel superior que define el flujo global.
Ejecuta trabajos para cargar datos desde diferentes orígenes de datos operativos externos en las tablas correspondientes y a continuación, ejecuta el trabajo para crear la despensa en el depósito de datos.
El trabajo
Build_Star llena la despensa de datos.
Realiza lo siguiente:
- Inicia el trabajo Dimensions para llenar las tablas de dimensiones
- Inicia Facts para llenar las tablas de hechos
- Inicia HistoricalLookups para llenar las tablas de búsqueda históricas.
Es posible personalizar estas compilaciones y secuencias de trabajos en función de la situación específica de su empresa y la implementación de estos productos.