Artigo do tipo Tutorial
Recursos especiais neste artigo:
Conteúdo sobre boas práticas.
Autores: Jean Cristian Ferreira Machado e Elton de Freitas

Desenvolvimento de cubos de dados OLAP com o SSAS
Neste artigo serão explorados conceitos sobre Online Analytical Processing (OLAP) e o módulo SQL Server Analysis Services (SSAS) presente na ferramenta Business Intelligence Development Studio (BIDS) da Microsoft. Para isso, inicialmente um banco de dados deverá ser criado e analisado, em seguida serão abordadas técnicas de modelagem de dados multidimensionais e componentes da ferramenta BIDS. Posteriormente, será criado um cubo de dados simples o qual permitirá que diversas consultas e análises sobre os dados sejam feitas.

Em que situação o tema útil
O conhecimento de técnicas para o desenvolvimento de cubos de dados multidimensionais é fundamental para profissionais e estudantes que anseiam em conhecer ou trabalhar na área de inteligência de negócios. Tais recursos são muito utilizados por grandes e médias empresas que visam obter informações gerenciais e diferenciar-se no mercado.

Nos dias atuais, há a necessidade de se descobrir o que os dados podem nos dizer, não basta apenas tê-los armazenados, mas precisam ser analisados. Assim, os cubos de dados são imprescindíveis na área de Business Intelligence (BI), muito utilizados na mensuração e análise de grandes volumes de dados. Um simples cubo de dados pode ser composto de informações básicas, dimensões e grupos de medidas. Tais informações básicas podem incluir o nome do cubo de dados, as medidas padrões do mesmo, sua fonte de dados, seu modo de armazenamento entre outras informações.

As dimensões de um cubo de dados definem os itens que vão classificar os dados contidos na tabela principal do mesmo, denominada fato, são elas que vão definir o tipo de pesquisa a ser feita no conjunto de dados do cubo. A tabela fato é a tabela que contem os dados ou medidas mais importantes do cubo.

Um grupo de medidas pode ser uma coleção de medidas que possui uma fonte de dados e um conjunto de dimensões comum entre si. Um grupo de medidas caracteriza-se por ser a unidade de processo entre as medidas.

Então o conceito de cubos de dados veio para melhorar a forma como os dados são armazenados em grandes volumes para serem consultados de forma rápida e precisa trazendo o histórico dos dados armazenados durante determinado período de tempo.

Criando e verificando o banco de dados

O processo de extração, transformação e carga de dados, conhecido como Extract, Transform, Load (ETL), foi realizado e exemplificado em artigos anteriores publicados nas edições 107, 108 e 110. O processo de ETL que foi descrito, aplica-se ao contexto de se obter dados a partir de um conjunto de arquivos PDF (processo de extração), transformar esses dados e colocá-los em uma base de dados temporária no SQL Server (processo de transformação), e depois carregá-los para um banco de dados que vai abrigar definitivamente estes dados (processo de carga dos dados).

Caso o leitor não tenha acesso às revistas citadas anteriormente e tenha interesse em praticar e desenvolver os cubos de dados multidimensionais a partir deste artigo, o script SQL cria_banco_concurso.sql, disponível para download no site desta edição, realiza a criação do banco de dados, tabelas e inserção dos dados obtidos através dos arquivos PDF.

...
Quer ler esse conteúdo completo? Tenha acesso completo