Lors de cette étape du cycle de conception du modèle dimensionnel, vous pouvez identifier les mesures et le type des mesures incluses dans le modèle dimensionnel.
Pour plus d'informations sur les mesures, voir Mesures.
Lorsque vous définissez les mesures, vous collectez les métadonnées suivantes :
- Nom de la table de faits
- Alias
- Grain
- Définition métier
- Fréquence et statistiques de chargement
- Statistiques d'utilisation
- Comment l'archivage des données est traité
- Mode et date de suppression des données
- Qualité et exactitude des données
- Grain des dimensions de date et d'heure
- Clés et mode de génération des clés
- Informations des sources de données
- Mesures
- Dimensions
- Informations de contact du propriétaire de la table
Identification des mesures correspondant au grain
Lorsque vous concevez les mesures d'un modèle, vous pouvez identifier les mesures correspondant au grain de chaque niveau du modèle.
Lorsque vous
avez identifié le grain du modèle dimensionnel, vous avez identifié des mesures préliminaires. Vous pouvez identifier d'autres mesures détaillées en examinant la définition du grain. Par exemple, si vous disposez de mesures détaillées, comme le coût de chaque produit ou le coût de fabrication par produit, vous identifiez toutes les mesures restantes du modèle.
Identification des types de mesure
Identifiez les types de mesure utilisés dans le modèle dimensionnel. Chaque mesure d'une table de faits doit être associée à une règle d'agrégration (ou de dérivation) par défaut.
Identification du mode de traitement des mesures Cumul à ce jour
Les mesures Cumul à ce jour sont des valeurs numériques correspondant à un total cumulé entre le début de l'année et la date du jour. Vous devez vous assurer que ces mesures ne sont pas incluses dans une table de faits avec les articles ligne au niveau atomique.
Supposons qu'une table de faits stocke les données des ventes de l'année 2005. Les ventes de chaque mois s'ajoutent et vous additionnez les ventes réalisées pour générer les totaux cumulés à ce jour. Si vous créez un fait Cumul à ce jour, tel que Ventes_$$_cumulées_à_ce_jour et que vous demandez ce fait en août 2005, vous obtenez la somme de toutes les ventes réalisées jusqu'en août 2005.
Les créateurs de modèles dimensionnels peuvent inclure des mesures Cumul à ce jour agrégées au sein de la table de faits pour améliorer les performances et réduire la complexité lorsque ce type de requête est créé. Pour éviter la confusion, vous devez calculer ces mesures dans l'application de rapport.
Traitez les mesures Cumul à ce jour en utilisant les méthodes suivantes :
- Applications OLAP
- Fonctions SQL dans des vues ou des procédures mémorisées
Spécification du mode de traitement des événements
Si la table est une table de faits basée sur des événements, vous devez déterminer comment les événements sont traités.
Les tables de faits de type événement sont utilisées pour enregistrer des événements, tels que les clics effectués dans une page Web ou la présence du personnel ou des étudiants.
Les événements ne donnent pas toujours lieu à des mesures. Si vous traitez des scénarios basés sur des événements dans lesquels il n'y pas de mesures, utilisez des tables de faits de type Evénement contenant des pseudo-faits ou des faits inexistants.
Prenez en compte les éléments suivants pour une table de faits basée sur des événements :
- Les tables de faits basées sur des événements contiennent généralement des pseudo-faits ou ne contiennent aucun fait.
- Utilisez des pseudo-faits pour effectuer les opérations de comptage.
- Une table de faits sans faits basée sur des événements ne comporte que des clés externes et ne contient pas de faits.
Utilisez les clés externes pour effectuer les opérations de comptage.
Prévision de la croissance de la table de faits
Prévoyez la taille et l'évolution de la table de faits pour déterminer comment vous pouvez adapter les performances du modèle dimensionnel.
Vous pouvez évaluer la taille et l'évolution de la table des faits en effectuant l'une des tâches suivantes :
- Comprendre l'activité
- Par exemple, supposons qu'un commerce de détail génère un chiffre d'affaires brut de 100 millions de dollars. Supposons également que le prix moyen d'un article est 2 dollars. Pour calculer le nombre d'articles dont vous avez besoin, divisez le chiffre d'affaires brut par le prix moyen d'un article :
100000000 / 2 = 50000000 lignes
Cinquante millions de lignes sont insérées dans le schéma en étoile pour le processus métier Ventes de détail, au niveau de ce grain.
- Effectuer des calculs dans une perspective technique
- Déterminez la taille des clés externes, des dimensions dégénérées et des mesures. Multipliez ces colonnes par le nombre de lignes qui peuvent être insérées en supposant que tous les produits sont vendus dans tous les magasins, tous les jours. Par exemple, dans le processus métier Ventes de détail, vous effectuez les opérations suivantes :
- Calculez le nombre de lignes au sein de chaque dimension :
Dimension Période : 4 lignes
Dimension Date : 365 lignes pour 1 an
Dimension Produit : 100 lignes (100 produits)
Dimension Magasin : 2 lignes (2 magasins)
Dimension Client : 1000000 clients
Dimension Fournisseur : 50 fournisseurs
Dimension Employé : 10 employés
- Calculez le niveau de base des enregistrements de fait en multipliant le nombre de lignes de chaque dimension. Utilisez les valeurs collectées à l'étape précédente :
4 * 365 * 100 * 2 * 1000000 * 50 * 10 = 730000000 lignes
Remarque : Ce nombre peut être plus élevé que prévu. Il s'applique uniquement si chaque produit est vendu dans chaque magasin par chaque employé à chaque client.
- Calculez l'augmentation maximale de la table de faits :
Nombre de clés externes : 8
Nombre de dimensions dégénérées : 1
Nombre de mesures : 8
Supposons que la table de faits utilise 4 octets pour une colonne INTEGER et calculez la taille d'une seule ligne :(8 + 1 + 8) * 4 octets = 68 octets
Calculez l'augmentation maximale des données sur une seule année pour le modèle dimensionnel :730000000 lignes * 68 octets = 45 Go