Maximizando o retorno do investimento da solução de Business Intelligence

 

por João Marcelo Borovina Josko


Organizações vêem rendendo-se ao fato que a informação, disponibilizada no momento certo e no formato adequado, tornou-se um ativo de extrema importância para seu capital humano intervir, com maior propriedade, sob a condução de seus negócios abarcados em um ambiente cada vez mais competitivo.

Neste contexto, as soluções de Business Intelligence – BI – provêem benefícios na reorganização e disseminação de informações internas e externas, promovendo a alavancagem dos processos decisórios. Esta, diferentemente das soluções de ERP e CRM facilmente copiadas pelo mercado concorrente, são concebidas sob medida a partir das necessidades informacionais da organização e, por isso, apresentam elevado valor estratégico ao negócio.

Não obstante a quantidade de literatura sobre esse assunto, ainda é notório deparar-se com casos de organizações frustradas com sua solução de BI que não alcançam o patamar de diferencial competitivo. Tal estado é decorrente de uma miríade de fatores que, sob diferentes aspectos, comprometem a qualidade da solução e desencadeiam um movimento de descrédito e desconfiança desta por parte das áreas de negócio que, no extremo, podem abandoná-la.

A falta de planejamento, a inexistência de processo de desenvolvimento, o envolvimento inadequado das áreas de negócio, o desconhecimento da qualidade e dos conceitos dos dados organizacionais, o conceito fragmentado ou distorcido do conceito de BI, o foco excessivo em tecnologias, constituem uma pequena parcela dos fatores que solapam essas soluções.

Há, porém, um fator repetidamente relegado ao segundo plano por muitas organizações, cuja relevância emerge quando essas se deparam com a grande dificuldade de suas soluções de BI em responder às novas necessidades de seu negócio. Este fator é conhecido como a Arquitetura de Data Warehousing – DW – ou Arquitetura de Business Intelligence.

Arquitetura de Data Warehousing: Conceito e Tipos

Parafraseando a idéia de qualidade de Crosby, o pior não é o que as pessoas desconhecem sobre esse tópico, mas sim o que elas pensam que é. A arquitetura apresenta como será o ambiente pela quais as informações das origens – sistemas transacionais ou fontes externas – serão transformadas em informações e, então, disponibilizadas aos tomadores de decisão. Além disso, delineia seus componentes, caracterizando-os quanto suas respectivas atribuições e inter-relacionamentos.

A literatura sobre Data Warehousing prove a discussão de algumas arquiteturas. Para o propósito deste artigo, selecionamos as principais. São elas:

 

§  Data Marts Independentes (Independent Data Marts)

§  Fábrica Corporativa de Informações (Corporate Information Factory)

§  Data Marts Relacionados (Linked Data Marts)

§  Data Warehouse Virtual


Data Marts Independentes

Esta arquitetura caracteriza-se pela presença de uma coleção de Data Marts – DM – construídos para atender necessidades específicas do negócio sem, contudo, a preocupação de conceituação corporativa dos dados. Desse modo, cada DM apresenta seu próprios dados, refinados e organizados pelo seus próprios procedimentos de ETL – Extração, Transformação e Carga – que partem diretamente das bases de dados transacionais, culminando o estabelecimento de silos de informação independentes, como mostrado na figura 1.

Enquanto essa abordagem alcança seu objetivo de disponibilizar informações às áreas de negócio de maneira rápida, o insulamento dos DM acarreta adversidades que se acumulam à medida que o número de membros cresce. Ademais a incapacidade de cruzamento das informações entre os DM, o grande número de procedimentos de ETL torna complexo o gerenciamento de códigos redundantes que, fatalmente, levam a um estado de informações inconsistentes

22-12-2007pic01.JPG
Figura 1 – Esquema geral da Arquitetura de Data Marts Independentes

As características dessa arquitetura, então, não a qualificam como a escolha de organizações que desejam analisar seus dados históricos sob uma perspectiva interdepartamental, mesmo àquelas que este represente um desejo de longo prazo. O emprego desta seria cabível – com muitas ressalvas – para uma organização que, após avaliação cuidadosa dos riscos, decida valer-se da sua rapidez de entrega para atender suas unidades organizacionais em detrimento de uma visão corporativa dos dados e dos custos envolvidos.

Fábrica Corporativa de Informações

Também conhecida como Hub-and-spoke ou CIF, esta arquitetura apresenta uma estruturação em camadas onde o elemento central, simbolizado por um grande repositório de dados, é responsável por alimentar os demais componentes que oferecerem as informações na visão desejada de análise, garantindo o desempenho no seu acesso – Figura 2.

O repositório central, denominado Data Warehouse, é desenvolvido após uma análise corporativa e abrangente dos requerimentos de dados, com o objetivo de criar um modelo normalizado – geralmente 3FN – e flexível. Seus dados apresentam-se com alto nível de qualidade e integração – graças aos refinamentos ocorridos na Staging Area –, bem como alto nível de granularidade, propiciando a transformação dos dados para atender diferentes óticas; do nível estratégico ao operacional, do departamental ao interdepartamental.

22-12-2007pic02.JPG
Figura 2 –
Esquema geral da Arquitetura de Fábrica Corporativa de Informações

A grande estruturação de seus componentes requer um maior volume de investimento, mas que se rever na amenização da administração da solução de BI, alavancagem do conhecimento sobre o negócio, dentre outros. A CIF é uma boa opção para àquelas organizações que a análise sem as fronteiras departamentais é essencial.

Data Marts Relacionados

Proposta por Kimball, esta arquitetura se caracteriza por construir Data Marts focados em necessidades específicas, mas que permitam cruzamentos dentre suas informações – Figura 3. Para tal, vale-se da reutilização ou compartilhamento das dimensões comuns presentes nos DM – denominadas Conformed Dimensions – o que demanda a discussão e a conceituação, com certa abrangência, dos objetos comuns ao negócio de uma organização.

22-12-2007pic03.JPG
Figura 3 –
Esquema geral da Arquitetura de Data Marts Relacionados por suas Dimensões

Para alcançar o objetivo de DM cruzáveis e consistentes, a área temporária – Staging Area – atua como ponto único de entrada dos dados provenientes das origens e de fornecimento posterior de dados tratados e íntegros. Além disso, a capacidade de cruzamento também requer que os DM apresentem o mesmo nível de consolidação, permitindo uma navegação transparente por entre as informações.

A característica dessa arquitetura a qualifica para as organizações que desejam criar uma base pronta para o consumo, mas que aceitam a conviver com certa inflexibilidade imposta pelo modelo multidimensional devido sua visão dirigida a uma necessidade, diferentemente de um modelo neutro como o Data Warehouse.

Data Warehouse Virtual

Os avanços na área de middleware corporativos, alinhados ao desejo da entrega “instantânea” das informações para atender a gestão operacional, culminaram na consolidação de uma arquitetura que provê acesso integrado aos dados sem, contudo, movimentá-los a outros locais de armazenamento – Staging Area e Data Warehouse, por exemplo.

O mecanismo do middleware, ilustrado na abaixo, é viabilizado pela tecnologia Enterprise Information Integration – EII – que, a partir do acesso direto as bases de dados – heterogêneas ou não – dos sistemas de informação, cria uma visão virtual integrada dos dados que podem ser utilizados por geradores de relatório, Data Marts, entre outros. Desta maneira, todas as vezes que essa visão é acessada, os dados são capturados e combinados em tempo de execução, semelhante ao funcionamento dos objetos views encontrados nos SGBDs de mercado.

22-12-2007pic04.JPG
Figura 4 –
Esquema geral da Arquitetura de Data Warehouse Virtual

Em razão da inexistência de bases intermediárias e da simplificação dos procedimentos de ETL, essa arquitetura propicia a criação ou manutenção de soluções muito rapidamente. Entretanto, o estágio da tecnologia de EII apresenta restrições quanto à manipulação de dados com baixa qualidade ou que envolvam grandes volumes. Essas restrições, caso ignoradas, podem
comprometer o desempenho do ambiente como um todo, haja vista que cria a concorrência pelos dados entre o Data Warehouse Virtual e demais sistemas de informação transacionais.

Frente a esse cenário, esta arquitetura é mais indicada para o emprego em situações onde a visão operacional e baixa latência dos dados são criticas – em detrimento a uma visão histórica –, sendo geralmente considerada como elemento complementar às arquiteturas supracitadas.

Fatores de ponderação da Arquitetura

Abaixo é elencado um conjunto de fatores que afetam potencialmente a decisão sobre a seleção de uma arquitetura. Esses cobrem aspectos não só do ponto de vista técnico, mas também social. São eles:

1.    Nível de interdependência das informações entre as unidades organizacionais

2.    Nível de urgência de utilização das capacidades de BI

3.    Nível de restrição de recursos materiais e humanos

4.    Características das análises realizadas pelas áreas de negócio

5.    Visão estratégica da organização para BI

6.    Compatibilidade da solução de BI com pacotes existentes – ERP.

7.    Volume de histórico requerido

8.    Características técnicas – facilidades e dificuldades

9.    Fatores Sociais e Políticos

Conclusão

A arquitetura constitui um componente essencial do software que afeta seu nível de flexibilidade para manutenções. Quanto menor for o nível dessa propriedade, menor será a habilidade do software em evoluir em resposta às mudanças do negócio.

A dificuldade supracitada, dentro do cenário BI, convida as áreas de gestão a agir por conta própria na captura e organização dos dados requeridos ao seu trabalho, empregando quaisquer mecanismos disponíveis em mãos. Esse “leve desespero” acarreta o aparecimento de oásis informacionais que, no curtíssimo prazo, causam a falsa impressão de solução do problema. Porém, à medida que o tempo passa, os tomadores de decisão percebem que os oásis são miragens que encobrem uma realidade de informações inconsistentes.

A arquitetura, portanto, representa o alicerce da solução de BI permitindo sua evolução ao mesmo tempo em que prove economia de escala. Sua flexibilidade, então, determina o nível do retorno do investimento realizado. Posto isso, o processo de escolha envolve a apreciação cuidadosa de considerações técnicas e do negócio de forma a determinar-se qual arquitetura – ou mix de arquiteturas – se encaixa melhor à visão estratégia de inteligência do negócio da organização.

Referências bibliográficas

CROSBY, Philip. “Qualidade é investimento”. Editora José Olympio, 1992.

INMON, W. H., IMHOFF, Claudia, SOUSA, Ryan. “Corporate Information Factory”. Editora Wiley, 2001.

KIMBALL, Ralph, REEVES, Laura, ROSS, Margy, THORNTHWAITE, Warren. “The data warehouse lifecycle toolkit”. Editora Wiley, 1998.