Las claves sucedáneas unen las tablas de dimensiones a la tabla de hechos. Las claves sucedáneas son un medio importante para identificar cada instancia o entidad en una tabla de dimensiones.
Razones para utilizar las claves sucedáneas
- Las tablas de datos de varios sistemas de origen OLTP pueden utilizar distintas claves para la misma entidad.
- También es posible que una sola clave sea utilizada por distintas instancias de la misma entidad. Esto significa que distintos clientes se pueden representar utilizando la misma clave en distintos sistemas OLTP.
Esto puede constituir un grave problema al intentar consolidar la información de diversos sistemas de origen. O para las empresas que intentan crear/modificar depósitos de datos después de fusiones y adquisiciones. Los sistemas existentes que proporcionan datos históricos pueden haber utilizado un sistema de numeración diferente al sistema OLTP actual. Además, es posible que los sistemas desarrollados independientemente no utilicen las mismas claves, o que utilicen claves que estén en conflicto con los datos de los sistemas de otras divisiones. Esta situación puede no causar problemas si cada departamento notifica independientemente datos de resumen, pero sí lo puede causar si se intenta conseguir una vista a nivel de empresa de los datos.
Esto significa que no podemos confiar en utilizar las claves primarias naturales del sistema de origen como claves primarias dimensionales, ya que no existe garantía de que las claves primarias naturales sean exclusivas para cada instancia.
Una clave sucedánea identifica de forma exclusiva cada entidad de la tabla de dimensiones, independientemente de su clave de origen natural. Esto se debe fundamentalmente a que una clave sucedánea genera un valor entero simple para cada nueva entidad.
- Las claves sucedáneas proporcionan el medio para mantener la información de depósito de datos cuando cambian las dimensiones.
- Las claves sucedáneas son necesarias para gestionar los cambios en los atributos de las tablas de dimensiones.
- Las claves del sistema OLTP naturales pueden cambiar o ser reutilizadas en los sistemas de datos de origen.
- Algunos sistemas tienen claves de reutilización pertenecientes a datos obsoletos o para datos que se han purgado. No obstante, una clave puede seguir utilizándose en los datos históricos del depósito de datos, y la misma clave no se puede utilizar para identificar distintas entidades.
El diseño, implementación y administración de las claves sucedáneas es responsabilidad del equipo de depósito de datos. Las claves sucedáneas se mantienen en el área de preparación de datos durante el proceso de transformación de datos.
- Mejorar el rendimiento de las consultas
- Las claves sucedáneas en enteros cortos conllevan una tabla de hechos más estrecha. Cuando más estrecha sea la tabla de hechos, mejor será el rendimiento.
- Gestionar casos de excepción
- Si se deben determinar requisitos o no son necesarios, utilice una clave sucedánea.
- Los cambios o la realineación de medidas debe llevarse a cabo en una columna independiente de la tabla.
- Si se deben revisar o resumir los datos, independientemente del número de veces que aparezcan en la tabla, debe utilizar esa columna como parte de la clave sucedánea.
Evite los identificadores exclusivos globalmente como claves sucedáneas
Los identificadores exclusivos globalmente funcionan bien en los sistemas OLTP de origen, pero son difíciles de utilizar cuando se trata de depósitos de datos. Esto de debe fundamentalmente a dos razones:
- Los identificadores exclusivos globalmente utilizan una importante cantidad de espacio en comparación con los correspondientes enteros. Los identificadores exclusivos globalmente ocupan aproximadamente 16 pulgadas cada uno, mientras que un entero ocupa alrededor de 4 bytes.
- Los índices de las columnas de identificadores exclusivos globalmente son relativamente más lentos que los índices de las claves de enteros, ya que los identificadores exclusivos globalmente son cuatro veces más grandes.