Este é um post disponível para assinantes MVPArtigo SQL Magazine 13 - Modelagem de Data Warehouses e Data Marts – Parte 1
Artigo da Revista SQL Magazine - Edição 13.
Clique aqui para ler todos os artigos desta edição
Modelagem de Data Warehouses e Data Marts – Parte 1
por Isabel Cristina Italiano e Luiz Antonio Esteves
Leitura Obrigatória: SQL Magazine 3, artigo Descubra o Data Warehouse: Produtividade e rapidez.
De uma forma simples, data warehouses e data marts existem para responder questões que as pessoas têm sobre os negócios. São uma base de informações consolidadas, integrada e não volátil, para apoiar os processos de tomada de decisões estratégicas, táticas e também operacionais de organizações. Esta função contrasta fortemente com o propósito dos sistemas transacionais (sistemas que apóiam a operação da empresa) e requer que o desenho ou o modelo de dados do data warehouse siga princípios completamente diferentes. Vários aspectos considerados de extrema importância na modelagem de sistemas transacionais como a aplicação de rígidas regras de normalização são, muitas vezes, deixados de lado ao se modelar um data warehouse ou data mart.
Na edição 3 - ano 1 desta revista, você pode encontrar uma visão geral da arquitetura, etapas da implementação e utilização de um data warehouse. Este artigo tem por objetivo mostrar os detalhes que envolvem uma das técnicas utilizadas para a modelagem dos dados em data warehouses e também em data marts, a modelagem dimensional. Essa técnica segue a chamada “escola Ralph Kimball”, introdutor do conceito do “star schema”. Na segunda parte deste artigo, a ser publicada em edição futura da SQL Magazine, apresentaremos detalhadamente o “star schema” e sua variação normalizada: o “snowflake schema”. Na terceira parte, abordaremos outra técnica utilizada para modelagem apenas de data warehouses, a modelagem relacional desnormalizada, que segue a chamada “escola Bill Inmon”, considerado o “pai” do conceito de data warehouse.
A modelagem dimensional e suas implementações
As técnicas de modelagem dimensional de um data warehouse, se aplicadas corretamente, garantem que (1) o desenho do data warehouse reflita a forma de pensar dos analistas de negócio e gerentes da empresa e (2) possa ser usado eficazmente para atender os seus requisitos de negócio. Aliás, este é o princípio básico da modelagem de um data warehouse: discutir diretamente com o usuário final sua visão do modelo de negócios e fazer com que esta visão seja refletida na base de informações.
O data warehouse deve ser desenhado para transpor os limites de cada um dos sistemas transacionais. Ele é construído para responder questões que não estão limitadas às transações ou aos sistemas individuais, apresentando, desta forma, uma visão integrada e completa dos negócios. Uma das técnicas utilizadas para se obter um modelo para o data warehouse que identifique e represente as informações importantes para o modelo de negócios é a modelagem dimensional ou multidimensional. Quando bem definido, o modelo dimensional pode ser uma ajuda de valor incalculável para as áreas de negócio, apoiando e otimizando todo o processo de tomada de decisões. O modelo dimensional representa:
· os indicadores importantes para uma área de negócios, que são chamados de fatos ou métricas;
· os parâmetros através dos quais estas métricas são analisadas pelos usuários, que são chamados de dimensões (as dimensões de negócios).
A Figura 1 apresenta um modelo dimensional simplificado para um processo de pedidos. As métricas definidas neste modelo estão no quadro central e as dimensões estão representadas nos quadros ao redor das métricas. As métricas são sumariadas (agregadas) ou detalhadas de acordo com o interesse da análise a ser feita sobre os dados. Este modelo é fácil de ser entendido por uma pessoa da área de negócios, já que “as coisas que eu avalio” estão na parte central do diagrama e “as formas de se olhar para elas” estão nos quadros em volta.

Figura 1. Visão de negócios de um modelo para processo de pedidos (note que esta é a visão do usuário e que ainda não estamos considerando todos os atributos a serem implementados).
Fica fácil perceber que estes quadros facilmente se transformarão em tabelas (com alguns atributos adicionais) utilizadas para armazenar toda a informação necessária. Um modelo como este não muda muito ao ser implementado em um banco de dados relacional (RDBMS). Cada quadro com os atributos de uma dimensão se torna uma tabela, chamada de tabela dimensão, e o quadro central se torna uma grande tabela, chamada tabela fato, que contém, por vezes, milhões ou bilhões de linhas.
Porém, os modelos dimensionais nem sempre são implementados em bases de dados relacionais. Existem no mercado bancos de dados multidimensionais, ou MDDBS, que armazenam informações em um formato diferente, freqüentemente chamado de cubos. Os cubos são construídos de tal forma que, cada combinação de atributos das dimensões com uma métrica ou é precalculado ou é calculado muito rapidamente.
ATENÇÃO! A exibição deste artigo foi interrompida.
Este é um post disponível para assinantes MVP



0
0
