Dando continuidade à nossa série sobre o Analysis Services, trataremos hoje sobre modelagem multidimensional, star schema e snowflake schema, além de falarmos sobre as formas OLAP existentes.

Modelagem Multidimensional

Técnica de modelagem utilizada para representar as diferentes visões pelas quais um mesmo conjunto de informações pode ser analisado. A modelagem multidimensional visa facilidade de entendimento e desempenho nos acessos aos dados. Existem duas formas básicas de representar um modelo multidimensional usando bancos de dados relacionais: star schema (esquema estrela) e snowflake schema (esquema floco de neve). Vejamos a seguir.

Star Schema

É composto de uma tabela central, com chave composta, chamada tabela fato, e um conjunto de tabelas menores e periféricas, chamadas tabelas dimensões.

Star Schema

Tabelas de Fato

Corresponde à tabela central que reúne o conjunto de medidas que podem ser analisadas através de várias visões e que contribuem para apurar o resultado de um processo de interesse ou para sinalizar tendências e oportunidades de negócio.

Tabelas de Fato

Os campos vendas, comissão e desconto, na parte inferior da tabela fato, são chamados de métricas ou medidas. Tais campos possuem dados numéricos dos quais podem derivar diferentes informações dependendo da visão empregada sobre os mesmos.

Tabelas de Dimensão

São perspectivas através das quais uma ou mais medidas da tabela fato podem ser analisadas. Uma dimensão é composta por atributos, altamente correlacionados, e é identificada através de um atributo chave.

Tabelas de Dimensão

Snowflake Schema

Técnica de modelagem que consiste em normalizar uma tabela dimensão removendo os atributos do tipo texto de baixa cardinalidade e colocando-os em dimensões secundárias, estabelecendo um relacionamento entre as mesmas.

Snowflake Schema

Considerações sobre Snowflake Schema

As duas opções de modelagem acima descritas são amplamente utilizadas em data warehouses de produção nas corporações atuais. Entretanto, qual das duas formas é melhor? A resposta

é: não há forma melhor por si só. É importante a análise do negócio para a decisão correta em se utilizar um ou outro modelo.

Há ainda situações em que os dois modelos coexistem num mesmo data warehouse. De uma forma geral, seguem algumas diretrizes que podem ajudar na decisão de quando usar o snowflake.

Porque usar:

  • Representa uma redução considerável do espaço em disco ocupado;
  • Contribui para a estabilidade na manutenção de uma dimensão.

Porque não usar:

  • Compromete a performance durante a navegação (browsing) pelo modelo;
  • Compromete a compreensão do modelo por parte do usuário final.

Formas de OLAP

A grande maioria das ferramentas de processamento analítico online possuem a capacidade de trabalhar com as várias modalidades de OLAP. As três formas são: ROLAP, MOLAP e HOLAP. A seguir, algumas características de cada uma das modalidades.

ROLAP – Relational + OLAP

É exatamente a modelagem multidimensional, que vimos nos itens anteriores, implementada em um banco de dados relacional. Não contém dados pré-calculados, o que significa que a consulta é executada no banco de dados no momento da solicitação. Em algumas situações, por isso, são mais lentos que a tecnologia MOLAP. A modalidade ROLAP é apropriada para grandes volumes de dados e necessidade de dados detalhados. Sua utilização é recomendada quando os usuários não sabem exatamente o que vão perguntar ao longo do tempo (consultas ad hoc).

MOLAP – Multidimensional + OLAP

Essa modalidade de OLAP utiliza objetos conhecidos como “cubos” de dados que nada mais são do que dados pré-calculados, considerando todas as possíveis respostas para um dado conjunto de consultas. Essa característica confere boa performance, independente da quantidade de dimensões da consulta.

Algumas alterações levam à necessidade de recalcular o “cubo” de dados o que pode deixá-los muito grandes à medida que novas dimensões e dados detalhados são acrescentados. Sua utilização é recomendada quando os usuários têm problemas relativamente dentro de um escopo (eles querem perguntar as mesmas questões todo dia / semana / mês), ou seja, suas consultas são previamente conhecidas.

HOLAP – Híbrid + OLAP

Algumas ferramentas fornecem as duas modalidades de OLAP anteriores. Dessa maneira, cabe ao analista de negócio, analisando consulta por consulta, decidir que forma de OLAP aplicar a cada um dos casos.

Conclusão

Neste artigo comentamos sobre conceitos importantes e necessários para o desenvolvimento de qualquer solução de business intelligence. Nos próximos artigos da série, entraremos nos aspectos específicos da ferramenta Analysis Services 2005. Espero vocês lá!