Al crear un modelo de datos físicos, se debe correlacionar el modelo de datos lógicos con las estructuras físicas de una base de datos que aloja el depósito de datos.
Al crear un modelo de datos físicos, debe definir estructuras físicas, como las tablas y tipos de datos que utilizará cuando se almacenen los datos.
También debe definir nuevas estructuras de datos que pueden mejorar el rendimiento de las consultas.
Sin embargo, debe definir nuevas estructuras sin cambiar el significado del esquema del modelo de datos lógicos.
Tenga en cuenta las siguientes consideraciones cuando cree un modelo de datos físicos:
- ¿Qué nivel de escalabilidad tiene el diseño? ¿Qué nivel de escalabilidad tiene el sistema de gestión de bases de datos físicos (DBMS)?
- ¿Qué consultas, procesos ETL y otras aplicaciones requiere el depósito de datos?
- ¿Hay algún modelo de datos abstracto que pueda utilizar para mejorar el rendimiento?
- ¿Cómo utilizará o realizará el mantenimiento del depósito de datos?
Nota: El modelado de datos físicos en el proceso de transacción en línea (OLTP) no difiere mucho del modelado físico del depósito de datos.
En el nivel de modelo conceptual, el modelado de datos físicos de OLTP difiere principalmente en el diseño de rendimiento. En OLTP, el diseño se centra en los volúmenes de datos y de transacciones, mientras que en el modelo de datos físicos de depósito de datos se centra en el rendimiento de la carga, el rellenado de las áreas de análisis y las tablas de resumen por parte de aplicaciones por lotes o en tiempo real, y en el rendimiento de las consultas analíticas.
Para crear un modelo de datos dimensionales físicos, realice los pasos siguientes:
- Modele las entidades y los atributos del modelo de datos físicos:
- Defina una tabla para cada entidad del modelo de datos lógicos.
Asigne un nombre a cada tabla.
- Cree columnas para cada uno de los atributos de las entidades del modelo de datos lógicos. Asigne un nombre y un tipo de datos a cada columna.
- Defina las claves primarias y foráneas de cada tabla.
- Cree el DDL del modelo de datos físicos:
- Cree la base de datos de destino.
- Conecte con la base de datos de destino.
- Genere el DDL.
- Implemente el DDL.
- Diseñe y ajuste el rendimiento del modelo de datos físicos. Ajuste las entidades y relaciones que se obtienen del modelo de datos lógicos y céntrese en cómo se rellenan esos objetos. El rendimiento del rellenado se ajusta utilizando uno de estos dos métodos:
- Rellenado por lotes
- Utilice las aplicaciones personalizadas, las herramientas ETL o los programas de utilidad de base de datos que proporcionen un buen rendimiento.
- Rellenado en tiempo real
- Utilice procesos y técnicas que permitan que los datos estén disponibles más rápidamente. Por ejemplo, en vez de utilizar el proceso ETL típico, utilice un proceso ELT (extraer, transformar y cargar). En el proceso ELT, los datos se extraen y cargan antes de que se realice la transformación, lo que puede mejorar el rendimiento.
Nota: El rendimiento depende de las estructuras de datos físicos.
La modificación o adición de estructuras físicas más apropiadas puede mejorar el rendimiento de las consultas, de las extracciones de datos o de las réplicas. Sin embargo, la adición de más estructuras físicas también puede aumentar el tiempo de carga del depósito de datos. El ajuste de rendimiento permite minimizar los costes.
Por ejemplo, el rendimiento siempre se puede mejorar añadiendo más CPU y recursos de E/S, pero debe buscar un compromiso entre un rendimiento aceptable y el coste total del sistema.
- Verifique el diseño físico asegurándose de haber abordado las áreas siguientes:
- El script DLL del modelo físico debe definir correctamente las estructuras físicas, incluidas las mejoras del rendimiento.
- El diseño físico debe estar totalmente documentado.
- Cada entidad del modelo de datos lógicos debe representar una tabla física, incluidos los atributos y relaciones adecuados.
- Cada relación debe describir cardinalidades correctas (uno a uno, uno a muchos, muchos a muchos).
- Describa correctamente cada entidad y atributo en el diccionario de datos.
- Valide todas las estimaciones de capacidad.