O armazém de dados operacional é uma área física no armazém de dados que contém a captura instantânea mais recente dos dados operacionais. Durante o processo extract, transform, and load (ETL), as construções extraem dados do sistema operacional e os mapeiam para a área do armazém de dados operacional no armazém de dados. Este tópico é uma visão geral do armazém de dados operacional usado no catálogo de amostra.
Extraindo dados
Os dados de origem são extraídos por meio do driver ODBC XML a partir de serviços de dados ou de arquivos de dados XML. Os dados de serviços de dados são extraídos por meio de migração de dados: pequenas construções ETL extraem os dados e os armazenam em tabelas temporárias a partir das quais outras construções ETL selecionam, transformam e mapeiam esses dados para a área do armazém de dados operacional do armazém de dados. Para produtos que suportam carregamentos delta, a extração de serviços de dados é feita por meio de carregamentos delta. A estrutura de dados de origem é específica da origem de dados. Os atributos são extraídos de acordo com os objetivos de medida. Portanto, nem todos os atributos disponíveis nas origens de dados são carregados no armazém de dados.
Transformando dados
Entregando dados
Um atributo de controle fornecido pelo Data Manager, este atributo se aplica a um número exclusivo para cada linha e deve ser mapeado para a coluna de surrogate key na tabela do armazém de dados.
Um atributo de controle fornecido pelo Data Manager, este atributo se aplica à data em que uma linha existente foi atualizada e deve ser mapeada para a coluna REC_TIMESTAMP na tabela do armazém de dados.
Esta coluna no armazém de dados deve ser usada para armazenar o GUID da origem de dados, que pode ser usado para diferenciar dados de diferentes origens. Para origens de dados nas quais os dados são extraídos por meio do driver ODBC XML, um GUID é automaticamente designado a cada grupo de recursos e o valor colocado em cada tabela na coluna DATASOURCE_ID, que deve ser mapeada para a coluna SOURCE_ID na tabela do armazém de dados. Para outras origens de dados nas quais o driver ODBC XML não é usado, o valor precisa ser fornecido manualmente.
Um atributo para armazenar o número inteiro ou tipo de caractere da chave natural da origem de dados.
Um atributo para armazenar um identificador visível pelo usuário, se a origem de dados tiver um.
Um atributo para armazenar a URL de um recurso XML de uma origem de dados
Um atributo para alguns artefatos comumente usados, tais como, projetos, pedidos, requisitos, tarefas, atividades e componentes. Este atributo pode ser usado para classificar ainda mais os dados nestas tabelas. Para cada um destes artefatos, uma tabela com _CLASSIFICATION no nome é definida no armazém de dados e os IDs e valores são predefinidos quando o armazém de dados é criado. As construções ETL que entregam estes artefatos no armazém de dados devem especificar o valor do ID de classificação e mapeá-lo para a coluna correspondente com _CLASS_ID no nome.