Áreas de almacenamiento de datos
RIDW contiene tres áreas de almacenamiento de datos:
Nombre de tabla | Finalidad de la tabla |
---|---|
SYS_CONFIG | Contiene información de configuración del sistema, como, por ejemplo, el tipo de calendario de dimensión de la fecha. |
ETL_INFO | Contiene información de configuración de extracción, transformación y carga (ETL), como, por ejemplo, planificación ETL (diaria, semanal o mensual) |
También se añaden dos columnas de control adicionales: ISSOFDELETED y REC_DATETIME.
Claves sucedáneas
Las claves sucedáneas son las claves primarias creadas por el proceso ETL. Son necesarias para alterar temporalmente las diferencias entre los formatos de las claves primarias desde diferentes orígenes. En cada tabla extraída, RIDW crea sus propias claves primarias y conserva la clave original en las columnas EXTERNAL_KEY1 o EXTERNAL_KEY2. Las claves sucedáneas son enteros basados en 0.
Tablas de clasificación
Son tablas que representan artefactos utilizados habitualmente, como, por ejemplo, proyectos, solicitudes, requisitos, tareas, actividades y componentes. Se reconocen por el nombre, que contiene la palabra “CLASSIFICATION”. Cada tabla de clasificación contiene un tipo de registro definido previamente que representa un conocimiento común del artefacto. El proceso ETL gestiona la conversión de tablas extraídas en tablas de clasificación.
Registro ficticio
Todas las clasificaciones y tablas de artefactos contienen una fila ficticia identificable mediante un valor de clave primaria de -1. Las filas ficticias dan soporte a la normalización de los datos en caso de que se definan valores nulos de las restricciones referenciales.
El área de hechos y dimensiones implementa un diseño con un esquema de estrella, que es un conjunto de hechos, dimensiones y tablas de rastreabilidad histórica. Una tabla de hechos contiene las medidas o ‘hechos’ de un proceso empresarial determinado. Por ejemplo, si la gestión de proyectos es un proceso que se desea medir, entonces una tabla de hechos correspondiente podría contener el número de requisitos. Las tablas de dimensiones contienen atributos empleados para restringir y agrupar datos cuando se realizan consultas de almacenamiento de datos. Si el número de requisitos es una tabla de hechos, tal vez desee utilizar como dimensión el tipo de requisito.
Convenios de diseño
Los nombres de tablas de dimensiones empiezan por “D_” y tienen teclas sucedáneas para identificar registros. Los nombres de tablas de hechos empiezan por “F_”, mientras que las tablas que ofrecen una visión histórica sobre las medidas encontradas en las tablas de hechos empiezan por “H_”. Normalmente, la clave primaria es una combinación de clave sucedánea de la medida y la clave sucedánea del artefacto que ha contribuido a la medida. Los nombres de tablas de hechos que empiezan por “F_C_” son equivalentes a la tabla de hechos de tendencias originales, salvo que sólo almacenan la instantánea más reciente de los datos, mientras que las otras acumulan datos para que se muestren las tendencias a lo largo del tiempo. La despensa de datos también comprende un conjunto de vistas que ofrecen una ventana al almacén de datos operativos, con la finalidad de profundizar más para obtener más detalles o la posibilidad de ofrecer informes de listas.
Columnas de control
Todas las tablas de hechos tienen una columna que hace referencia a la dimensión de fecha D_DATE. En cuanto a las tablas de tendencias, la fecha en este contexto indica la fecha en que se realizó la instantánea de los datos. Para las otras tablas de hechos, la fecha refleja la aparición de un suceso, como por ejemplo, la creación de un registro. La instantánea de los datos se puede etiquetar en función de si es ‘por día’, ‘por semana’, o ‘por mes’ en función del valor almacenado en la tabla SYS_CONFIG del área de configuración. Otras columnas de control incluyen la columna REC_DATEIME, que sirve de indicación de registro para la inserción o actualización de un registro.
Registro de indicadores NULL
Al igual que en el almacén de datos operativos, las tablas de dimensiones contienen una fila de indicadores NULL identificable con un valor de clave primaria de -1. Representa el valor NULL para tablas con restricciones.