Implementa��o de uma ferramenta de BI

Atualmente nas micro e pequenas organiza��es existe uma defici�ncia com rela��o ao aproveitamento das informa��es armazenadas em suas bases de dados. Com base nisso, a ferramenta desenvolvida tem o intuito de prover a alta dire��o uma vis�o estrat�gica baseada em dados hist�ricos.

Com o grande aumento de dados gerados e armazenados nas empresas, torna-se necess�rio o uso mais eficiente destes dados, gerando informa��es consistentes e consolidadas para auxiliar na tomada de decis�o.�As micro e pequenas empresas n�o utilizam sua informa��o em massa, dispon�veis em suas bases de dados, e geralmente utilizam sistemas computacionais para as opera��es b�sicas da empresa onde somente poucos relat�rios s�o disponibilizados. Para uma maior vantagem competitiva, e para se manter no mercado, cada vez mais as empresas s�o obrigadas a utilizarem as informa��es armazenadas gerando conhecimento e se destacando entre seus concorrentes.

Diante deste contexto o projeto proposto tem como objetivo utilizar a tecnologia como meio de processamento e facilitar o entendimento das informa��es no contexto dos neg�cios, atrav�s do desenvolvimento de uma ferramenta para a constru��o de DW -Data Warehouse�de forma din�mica e a extra��o e sumariza��o de informa��es operacionais contidas em bancos de dados estruturados, aplicando regras de neg�cio espec�ficas para armazenar estas informa��es em um reposit�rio espec�fico, ou seja, um Data Warehouse�que servir� de base para apresenta��o destas informa��es em forma de gr�ficos e indicadores auxiliando os empreendedores na tomada de decis�o.

No projeto foi desenvolvida uma aplica��o ETL (Extract Transform and Load) com a cria��o do DW e gera��o dos�scripts�para a obten��o dos dados da empresa, possibilitando a cria��o din�mica do DW baseado na necessidade e disponibilidade de informa��es contidas na base de dados operacional da organiza��o. Al�m disto, � poss�vel realizar a execu��o dos�scripts�para a extra��o dos dados da fonte selecionada e a cria��o de cubos de decis�o baseado no DW constru�do, bem como a visualiza��o das informa��es atrav�s de gr�ficos e indicadores, ou seja, desenvolvimento de ferramenta BI.

Intelig�ncia de Neg�cios

BI (Business Inteligence, ou Intelig�ncia de Neg�cios), � um conjunto de conceitos e m�todos para auxiliar e aumentar a capacidade de tomada de decis�o das organiza��es, fazendo uso de acontecimentos (fatos).

Segundo Barbieri (2001), BI �representa a habilidade de se estruturar, acessar e explorar informa��es, normalmente guardadas em DW/DM (Data Warehouse/Data Mart), com o objetivo de desenvolver percep��es, entendimentos, conhecimentos, os quais podem produzir um melhor processo de tomada de decis�o�

SAD (Sistemas de Apoio � Decis�o) ou DSS (Decision Support Systems) s�o sistemas computacionais que fornecem informa��es e contribuem para o processo de tomada de decis�o. Permite a realiza��o de c�lculos, proje��es e an�lises por meio de gr�ficos comparativos.

Segundo Inmon (1997), os Sistemas de Apoio � Decis�o (SAD), tiveram in�cio na d�cada de sessenta, onde o processamento e an�lise eram realizados em aplica��es baseados em relat�rios, por�m, com o passar dos anos, o volume dos dados foi crescendo e a tarefa de an�lise tornou-se complexa e trabalhosa.

Data Warehouse�� um sistema computacional que atrav�s de transa��es e processos realiza c�pia de informa��es registradas nos bancos de dados das organiza��es reorganizando estas informa��es e preparando-as para a realiza��o de consultas, relat�rios e an�lises. Ou seja, trata-se de um armaz�m de dados extra�dos das bases operacionais que suprir� a necessidade das regras para cria��o de vis�es estrat�gicas e gerenciais para a alta administra��o.

Segundo Inmon (1997, p. 33), [...] �Data warehouse�� um conjunto de dados baseado em assuntos, integrado, n�o-vol�til, e vari�vel em rela��o ao tempo, de apoio �s decis�es gerenciais" [...].

Para Inmon (1997), a constru��o de um DW pode conter algumas caracter�sticas mencionadas abaixo:

Orientado por�Temas�- as informa��es armazenadas em�Data Warehouse�s�o organizadas pelos temas importantes para o neg�cio da empresa, podendo para o mesmo tema existir v�rios n�veis de detalhamento da informa��o. Por exemplo: vendas, faturamento, produtos, clientes, etc.
Integrado - no�Data Warehouse�integrado, os dados s�o consolidados de diversas origens. Para o correto funcionamento e realiza��o das an�lises os dados devem ser integrados perfeitamente para um modelo de informa��o apenas existindo assim, somente uma codifica��o para os dados armazenados.
Variante no Tempo - refere-se a um momento espec�fico da informa��o. As informa��es s�o carregadas como fotos da base de dados operacional do momento em que foram extra�das. Os dados n�o s�o atualizados e podem ser comparados ao longo do tempo, mantendo um hist�rico da trajet�ria da informa��o durante sua exist�ncia.
N�o Vol�til - um Data Warehouse n�o sofre qualquer altera��o em seus dados a n�o ser a adi��o de novas informa��es. � permitida apenas a carga e consulta dos dados armazenados. Existem algumas necessidades espec�ficas que podem exigir a corre��o ou altera��o das informa��es, por�m neste caso o recomend�vel � remover as informa��es e realizar nova carga corrigida ou alterada. Ap�s serem transformados e carregados, os dados ficam dispon�veis para a consulta pelos usu�rios. Esta volatilidade requer procedimentos para assegurar a integridade e consist�ncia atrav�s de�rollback, recupera��o de falhas,�commits�e bloqueios.

Outra caracter�stica importante no projeto de um DW � a granularidade, n�vel de detalhamento nos dados. Quanto mais baixo o n�vel de detalhamento mais baixo, ser� o n�vel de granularidade e quanto menos detalhes, mais alto o n�vel de granularidade. A granularidade nos primeiros sistemas operacionais era tida como certa, pois quando os dados eram atualizados, certamente seria ao mais baixo n�vel de granularidade sendo que no ambiente de DW, a granularidade n�o � um pressuposto (INMON, 1997).

ETL (Extract, Transform and Load) ou Extra��o, Transforma��o e Carga destina-se � extra��o, transforma��o e carga dos dados de uma ou mais bases de dados de origem para uma ou mais base de dados de destino (Data Warehouse). Este processo � o mais cr�tico e demorado na constru��o de um DW, pois consiste na extra��o de dados de bases de dados heterog�neas, transforma��o e limpeza destes dados e a realiza��o da carga destes dados no DW.

As decis�es gerenciais ser�o tomadas baseadas nas informa��es geradas pela ferramenta e armazenadas no DW sendo, portanto, que os dados devem representar a verdade, a mais pura verdade, nada mais que a verdade (KIMBAL, 1998). A maior parte do esfor�o exigido no desenvolvimento de um DW � consumido, e n�o � incomum que oitenta por cento de todo o esfor�o seja empregado no processo de ETL, (INMON, 1997).

De acordo com Kimball (1998), somente a extra��o dos dados leva mais ou menos sessenta por cento das horas de desenvolvimento de um DW. Esta parte do processo � respons�vel pela busca das informa��es importantes nas bases de dados de fontes externas que estejam em conformidade com DW. Esta busca pode ser obstru�da por problemas devido �s diversas plataformas diferentes gerando a demanda de utiliza��o de formas de extra��o diferentes para cada local.

Ap�s a extra��o dos dados, temos a transforma��o deles, a limpeza, a corre��o de poss�veis erros de digita��o, a descoberta de viola��es de integridade, a substitui��o de caracteres desconhecidos, a padroniza��o e a abrevia��o dos dados (GONSALVES, 2003).

Segundo Kimball (1998), as principais caracter�sticas para garantir a qualidade dos dados s�o:

unicidade, evitando assim duplica��o de informa��o;
precis�o, onde os dados n�o podem perder suas caracter�sticas originais;
completude, n�o gerando dados parciais de todo o conjunto relevante �s an�lises;
consist�ncia, os fatos devem apresentar consist�ncia com as dimens�es que comp�e.

O termo OLAP (Online Analytical Processing) pode ser interpretado com diversos significados, pois a sua tecnologia encontra-se presente em v�rias camadas como, por exemplo: armazenamento, acesso, compiladores, linguagem e conceitos. Pode-se falar em conceitos OLAP, linguagens OLAP, camadas de produtos OLAP e produtos completos OLAP (THOMSEN, 2002).

OLAP � ferramenta de BI (Business Inteligence)�utilizada para apoiar as empresas na an�lise de suas informa��es,�sendo formado por uma ou mais ferramentas com a finalidade de acesso e an�lise de dados�ad hoc�com o objetivo de transformar os dados armazenados no�Data Warehouse�em informa��o capaz de dar suporte � tomada de decis�o da alta administra��o por meio de interfaces amig�veis e de f�cil manipula��o.

OLTP (OnLine Transaction Processing), ou processamento de transa��es�on-line, n�o s�o apropriados para Data Warehouses, isto porque, n�o podem armazenar dados hist�ricos, n�o atendem satisfatoriamente a consultas e recupera��o r�pida de grande volume de informa��es.

Ao contr�rio da OLTP, OLAP oferece grande potencial de an�lise e recupera��o de informa��es de forma r�pida e f�cil, provendo um acesso seguro aos dados corporativos de um�Data Warehouse,�provendo ainda muita flexibilidade existente em programas dedicados � an�lise de dados.

Na proje��o de bases de dados para Data Warehouse, devemos quebrar o paradigma da elimina��o de redund�ncia, buscando realizar um armazenamento hist�rico. Por�m � necess�rio tomar cuidados para que esta redund�ncia n�o prejudique o projeto aumentando seu custo com armazenamento ou manuten��o.

No Esquema Estrela, as inst�ncias s�o armazenadas em uma tabela principal contendo o identificador da instancia, valores das dimens�es descritivas para cada inst�ncia e valores dos fatos, ou medidas. Pelo menos uma tabela � usada para cada dimens�o, armazenando os dados correspondentes aos dados encontrados na coluna referente �quela dimens�o na tabela de fatos (MACHADO, 2002). Sua composi��o parte por uma tabela dominante, chamada de tabela de fatos, no centro e em volta, cercada por tabelas auxiliares, chamadas de tabelas de dimens�o. A tabela de fatos conecta-se �s demais tabelas atrav�s de m�ltiplas jun��es.

Ferramenta desenvolvida

Com base na fundamenta��o te�rica e com a percep��o da necessidade atual do mercado em foco, foi desenvolvida uma ferramenta de BI que permite desde o processo de cria��o do DW at� a visualiza��o gr�fica das informa��es sumarizadas e organizadas. O processo de cria��o do DW ocorre de forma simples e din�mica, sendo necess�rio apenas o conhecimento na fonte de dados de origem e nas regras de neg�cio a serem abordadas para a cria��o dos cubos de an�lise.

A tela principal da aplica��o possibilita ao usu�rio realizar a constru��o de um DW ou realizar a conex�o com um DW j� existente. Com uma interface amig�vel e intuitiva, o usu�rio facilmente poder� realizar as opera��es dispon�veis na aplica��o.

Para iniciar a cria��o de um DW, � necess�rio possuir uma conex�o com uma base de dados de origem cadastrada. Ap�s conectado a uma base de dados de origem, pode-se iniciar a constru��o do DW, partindo pela cria��o da tabela fato. Para isso, o usu�rio deve dar duplo clique sobre a tabela origem desejada. Em seguida conforme ilustra a Figura 1, ser� exibida tela com todos os campos dispon�veis na tabela. O usu�rio, baseado no fato a ser criado, ir� marcar os campos necess�rios para a extra��o dos dados.

**Figura 1**. Campos da Tabela de Origem

Ap�s clicar em Criar Tabela Fato, ser� exibida uma tela conforme Figura 4, para indicar o nome do fato e a chave �nica da tabela a ser criada. Ao clicar no bot�o Gerar SQL, ser�o criados automaticamente os SQLs necess�rios para montar a estrutura do DW. A Figura 1 ilustra a visualiza��o dos SQLs gerados para o processo de cria��o da tabela, de sele��o dos dados, de limpeza, e de carga.

**Figura 2**. Tela de Cria��o da Tabela Fato com Scripts Gerados

O processo de cria��o dos scripts ocorre atrav�s de m�todos implementados na aplica��o realizando o tratamento dos dados e dos seus tipos, possibilitando a integra��o deles de forma consistente e segura. Para a normaliza��o dos dados foi criado m�todo para obter o tipo de dado original da tabela origem e transform�-lo em um tipo �nico, facilitando a manipula��o e tratamento das informa��es.

No exemplo foram criados os seguintes�scripts�SQL para a tabela fato vendas:

Script�de cria��o da tabela no DW consiste em um script de cria��o de tabela para o SGDB Firebird que ser� armazenado no cadastro da tabela e executado imediatamente ap�s a defini��o da tabela.
Script�de sele��o dos dados da tabela origem, criado automaticamente ser� utilizado para realiza��o da carga de informa��es para o DW, em conjunto como o script de carga.
Script�de limpeza da tabela criada no DW ser� utilizada toda vez que for realizada uma nova carga no DW, eliminando-se todos os dados e carregando novamente da base de origem.
Script�de carga da tabela fato criada no DW, ir� realizar a inser��o dos dados selecionados da tabela origem pelo script de sele��o e ir� alimentar a tabela correspondente do DW.

Basta clicar em criar para que os�scripts�de cria��o da tabela sejam executados e que as informa��es referentes � tabela fato sejam gravadas na base de dados do projeto DW em quest�o. A tabela ser� criada imediatamente no DW assim que executados os�scripts. Da mesma maneira que foi criada a tabela fato anteriormente, a tabela dimens�o segue o mesmo conceito, por�m ao inv�s de clicar em Criar Tabela Fato, ser� clicado em Criar Tabela Dimens�o. Ao clicar em gerar SQL, ser�o gerados todos os scripts de SQL necess�rios para cria��o da tabela dimens�o, bem como suas liga��es com a tabela fato correspondentes e seus scripts de sele��o, limpeza e carga de dados para o DW.

Durante o processo de cria��o das tabelas do DW, s�o criados tamb�m em tempo de execu��o e dinamicamente os scripts para a cria��o dos cubos baseado nas estruturas dos fatos criados atrav�s da utiliza��o dos metadados das tabelas. A Figura 3 demonstra o�script�montado.

**Figura 3**. Script�do Cubo Gerado Automaticamente

Com os dados agora carregados no DW, podemos realizar as an�lises deles, organizando, sumarizando, agrupando as informa��es a fim de obtermos conhecimento sobre elas de forma r�pida e f�cil. Baseado nos modelos criados anteriormente, a Figura 4 demonstra uma an�lise criada com base no fato vendas, onde podemos observar o montante de vendas por opera��o de vendedor.

**Figura 4**. Tela de Montagem dos Cubos de An�lises

Nesta tela ser�o realizadas todas as fases de an�lise e cria��o dos cubos. Podemos observar os menus que nos d�o a possibilidade de carregar um cubo j� criado e salvar, al�m de salvar o grid ou somente as suas informa��es, carregar um grid salvo, entre outras. Podemos exportar tamb�m esta informa��o para diversos formatos como: pdf, Excel, BMP e HTML.

Conforme forem criados os cubos podemos utilizar forma visual para facilitar e ajudar no processo de entendimento da informa��o. A Figura 5 demonstra o modo visual atrav�s do gr�fico de barras do cubo criado anteriormente, sendo que podemos selecionar diversos formatos de gr�ficos para a exibi��o das informa��es, como: gr�fico de barras, pizza, linha, barra horizontal, pontos entre outros.

**Figura 5**. Visualiza��o Gr�fica do Cubo Criado

Com o crescente uso de tecnologias para auxiliar as empresas na execu��o de seus processos operacionais, que realizam o armazenamento de milhares de informa��es hist�ricas referente �s suas transa��es, identificamos claramente a necessidade de abstrair estas informa��es operacionais, transformando-as em conhecimento com a aplica��o de regras espec�ficas possibilitando um melhor entendimento desta grande massa de dados. Com isso poderemos criar uma perspectiva de vis�o sobre estes dados hist�ricos auxiliando diretamente as decis�es estrat�gicas das organiza��es antecipando as mudan�as do mercado, as a��es dos competidores, identifica��o de novos potenciais e uma melhor prepara��o da organiza��o para atender o mercado.

Observando a situa��o atual das micro e pequenas empresas com pode-se perceber que apesar de existirem algumas ferramentas semelhantes, elas acabam por n�o chegarem a este mercado, pelo seu alto custo e complexidade de implanta��o e utiliza��o. Com isso, foi poss�vel perceber que podemos abranger uma grande massa de companhias oferecendo a elas n�o apenas a ferramenta, mas tamb�m a constru��o do seu�Data Warehouse�aplicado � sua necessidade espec�fica.

Visto � necessidade de se lan�ar � frente da concorr�ncia no mercado, a posse e interpreta��o das informa��es � um dos principais fatores que contribuem para um desempenho melhor de uma organiza��o.

Todo o processo de pesquisa realizado resultou na possibilidade de interpreta��o dos dados armazenados atrav�s da ferramenta que disponibiliza a visualiza��o das estruturas propriet�rias permitindo a cria��o do DW e aplicando a ETL, no formato de constru��o das tabelas de fatos e dimens�es de forma automatizada. O presente projeto tamb�m se apresenta com grande valia para o aprendizado e conhecimento de novos conceitos para a manipula��o e transforma��o de dados em informa��o, gerando conhecimento para auxiliar na tomada de decis�o.

Refer�ncias

BARBIERI, Carlos. Business Intelligence: modelagem e tecnologia. Rio de Janeiro: Axcel Books, 2001.
INMON, W. H. Como construir o Data Warehouse. 2. ed. Rio de Janeiro: Campus, 1997.
KIMBALL, Ralph.�Data Warehouse Toolkit.�Tradu��o M�nica Rosemberg; Revis�o�T�cnica�Ronal�Stevis�Cassiolato.�S�o�Paulo: Makron�Books,1998.
MACHADO, Felipe Nery Rodrigues. Tecnologia e Projeto de Data Warehouse. Rio de Janeiro: Editora Erica, 2002.
THOMSEN, Erik. OLAP: construindo sistemas de informa��es multidimensionais. 2. ed. Rio de Janeiro: Campus, 2002.

Confira outros conte�dos:

Por Rodrigo Em 2011

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Eder Emmel

Olá, ótimo artigo. Gostaria de saber se é possível encontrar a ferramenta (ou fonte) da aplicação demonstrada no artigo?

há +1 ano

Rodolfo Gomes

DevMedia

Maravilha Eder 😁

Ficamos felizes com seu feedback tão legal, vc pode baixar utilizando a opção "código fonte" na descrição do artigo.

Espero ter auxiliado.

TMJ