DATA WAREHOUSE APLICADO EM INSTITUIÇÕES DE ENSINO SUPERIOR

Data Warehouse applied in High Educational Institutions

HELITON LIBERATO SILVA JÚNIOR*

heliton_analyst@yahoo.com.br

 

RESUMO

As instituições de ensino superior possuem grande quantidade de sistemas que lhe auxiliam nas diversas atividades rotineiras, mas não dispõem de mecanismos que possam lhe fornecer informações gerenciais, de maneira rápida e com a confiabilidade necessária, para auxiliar os administradores nos processos decisórios. Esta ausência implica que medidas administrativas e decisões sejam tomadas baseadas no conhecimento e na experiência pessoal dos dirigentes [CLEMES, 01]. O uso de Data Warehouse fornece uma solução confiável, segura e de fácil acesso, aos gestores das instituições. O presente artigo tem por objetivo mostrar quais são as vantagens obtidas com a utilização do data warehouse em uma instituição de Ensino Superior.

Palavras-chave: Data Warehouse, informações gerenciais, instituição de ensino superior.

 

ABSTRACT

The High Educational Institutions posses great amount of systems in the diverse routine activities, but they don’t make to use of mechanisms that can supply managements information, in fast way and with the necessary trustworthiness,             to assist the administrators in the power to decide processes, this absence implies that administrative measured and decisions they are taken based in the knowledge and the personal experience of the controllers [CLEMES, 01]. The use of Warehouse Data supplies a trustworthy solution, secure and of easy access, to managers of the institutions. The present article has for objective to show which is the advantages gotten with use of the warehouse data in a High Education Institution.

Keywords: Data Warehouse, Management information, high educational institutions.  

* Graduando em Análise de Sistemas pelo Instituto de Ensino Superior Fucapi – CESF.

1      JUSTIFICATIVA DO ESTUDO

A adoção de tecnologias apropriadas para armazenar os dados que permitem as Instituições de Ensino Superior viabilizar a utilização para melhorar sua imagem e satisfação dos seus clientes (alunos, professores, sociedade.) é uma necessidade.

       Tendo esse contexto em vista, esse artigo mostra a importância de um data warehouse em Instituições de Ensino Superior, onde auxiliará nas tomadas de decisões aos gestores das instituições.

2      TEORIA

2.1 DATA WAREHOUSE

De acordo com REZENDE e ABREU (2003), em termos simples, data warehouse é um grande banco de dados que armazena dados de diversas fontes para geração de informações integradas, com base nos dados do funcionamento das funções empresariais operacionais de uma organização inteira. Assim, ele é freqüentemente chamado “armazém de dados” de uma empresa.

O data warehouse é o local em que as pessoas podem acessar seus dados. As metas fundamentais de um data warehouse podem ser desenvolvidas andando-se pelos corredores de uma organização de grande porte e ouvindo as conversas nas gerências [KIMBALL, 98]. Um data warehouse também é um banco de dados com ferramentas, que armazena dados atuais e históricos de interesse potencial para o gerente de toda a empresa [LAUDON, 01].

Em resumo, o processo de data warehouse auxilia na junção dos dados, integrando dados operacionais chaves em toda empresa numa forma consistente, segura e facilmente disponível para ser utilizada [KUHNEN e VIEIRA, 05 ].

2.2  CARACTERÍSTICAS DO DATA WAREHOUSE

Diversas, são as características de um data warehouse. [INMON e HACKATHORN, 97] listam as principais características de um data warehouse, sendo:

·        Orientação por assunto: a primeira característica notável do data warehouse é sua organização em torno dos assuntos mais importantes de uma organização, fazendo com que o projeto de um data warehouse seja “orientado a dados”. O mundo operacional é projetado em torno de aplicações e funções como empréstimo, poupança, cartões magnéticos e financiamentos.

·        Integração: a segunda característica diferenciatória é que por dentro, o data warehouse é integrado, com esta integração, o data warehouse adquire um sabor muito corporativo.

·        Variação no tempo: a terceira característica é que todos os dados no data warehouse são precisos em algum instante de tempo. Esta característica básica dos dados do data warehouse é muito diferente daqueles encontrados no ambiente operacional. No ambiente operacional, os dados estão corretos no momento do acesso, em outras palavras, no ambiente operacional, quando se acessa uma unidade de dados, é esperado que esta reflita valores corretos no momento do acesso.

·        Não volatilidade: a quarta característica definidora do data warehouse é que este não é volátil. Permite apenas a carga inicial dos dados e consultas a estes dados. A manipulação básica dos dados que ocorre no data warehouse é muito simples.

Em resumo, o data warehouse pode ser definido como um banco de dados, destinado a sistemas de apoio a decisão e cujos dados foram armazenados em estruturas lógicas dimensionais, possibilitando seu processamento analítico por ferramentas especiais [BARBIERI, 01].

 

2.3  NECESSIDADE DE UM DATA WAREHOUSE

Segundo INMON [apud CLEMES, 97], existe a noção de que se obtivermos corretamente os detalhes, de certa forma o resultado final surgirá automaticamente e alcançaremos o sucesso. É como dizer que se sabemos como concretar, como perfurar, e como instalar porcas e parafusos, não precisamos nos preocupar com a forma ou a funcionalidade da ponte que estamos construindo.

Diariamente, as organizações geram e captam dados sobre todos os aspectos dos seus negócios. Na maior parte delas, estes dados estão sendo armazenados e manipulados para suportar as atividades criticas (faturamento, almoxarifado, contabilidade, entre outros) através dos sistemas de processamento de transações on-line (OLTP) que tem como característica principal o baixo tempo de resposta para processar as suas requisições.

A obtenção de informações para a tomada de decisão, tendo como base os dados existentes nos sistemas OLTP, encontrou as seguintes limitações, segundo [GIOVINAZZO, 00]:

·        Integração: os sistemas operacionais geralmente estão dispersos por toda a organização e foram desenvolvidos ou adquiridos de forma independente ao longo do tempo, não possuindo a integração desejada. Utilizam diferentes tipos de bancos de dados, rodam em sistemas operacionais heterogêneos ou ambiente cliente/servidor, sendo difícil a sua integração. Exemplo: sistema contábil adquirido de terceiros que não integra com o sistema de patrimônio, sendo necessário o fornecimento de informações em ambos.

·        Histórico: os dados sofrem alterações constantemente, tornando difícil à repetição de uma operação que forneça as mesmas informações. Exemplo: o sistema de controle acadêmico não consegue reproduzir informações sobre o numero de alunos com situação regular em um determinado período.

Outros autores acrescentem outras limitações, tais como:

·        Desempenho: para processar uma grande quantidade de transações por segundo, os sistemas aplicativos armazenam dados em formatos que minimizam a duração dessas transações. Tentar extrair informações com base no mesmo sistema, degrada a performance das aplicações rotineiras SINGH [apud CLEMES, 01]. Exemplo: recuperar o total arrecadado com o pagamento de multas no sistema de bibliotecas nos últimos três anos.

·        Credibilidade: a discrepância entre as informações provenientes de dois departamentos que usam sistemas diferentes, pode levar a uma tomada de decisão baseada em interesses políticos ou opiniões pessoais [INMON, 97]. Exemplo: o total de professores com titulo de doutor fornecido pelo departamento de capacitação que utiliza o sistema “A” não coincide com o total de professores com titulo de doutor fornecido pelo departamento de pagamentos que utiliza o sistema “B”.

·        Redundância: os mesmos dados estão em inúmeras bases de dados diferentes. Isso significa que os mesmos dados são inseridos, atualizados e mantidos por diversas pessoas, sistemas e processos, consumindo recursos de hardware, software e humano MOSS [apud CLEMES, 00]. Exemplo: dados de alunos mantidos no sistema acadêmico e no sistema de biblioteca.

2.4  ARQUITETURAS DE DATA WAREHOUSE

As arquiteturas de Data Warehouse ainda não estão bem definidas e sua classificação ainda é bastante confusa. Apesar disso, vários autores concordam com a classificação das arquiteturas em arquiteturas funcionais e arquiteturas de acesso aos dados [SINGH, 01].

2.4.1        ARQUITETURA DE ACESSO AOS DADOS

São as diferentes formas com que os dados são acessados e trabalhados pelas ferramentas analíticas [SCHOLOTTGEN, 01]. Os principais tipos de arquiteturas de acesso estão descritos abaixo:

a.      ROLAP: os dados são armazenados em SGBD relacionais. A palavra ROLAP vem de R (relacional) + OLAP, e significa fazer consultas OLAP em SGBDs relacionais. É a solução mais utilizada hoje.

b.      MOLAP: os dados e agregações são armazenados em SGBDs multidimensionais, otimizados para consultas analíticas. Teoricamente, é a melhor arquitetura, mas a falta de SGBDs multidimensionais mais consolidados dificulta sua aplicação.

c.      HOLAP: é uma arquitetura hibrida, entre o ROLAP e o MOLAP. A idéia é armazenar os dados de maior granularidade do Data Warehouse em estruturas relacionais normalizadas e os agregados de menor granularidade em estruturas dimensionais nativas como cubos OLAP. A palavra HOLAP vem de H (hibrido) + OLAP.

2.4.2   ARQUITETURA FUNCIONAL

A arquitetura funcional descreve o fluxo de dados dos sistemas operacionais existentes até os usuários e as transformações que esses dados sofrem ao longo do processo. A arquitetura funcional é dividida em duas grandes áreas por [KIMBALL, 98]: a área interna, responsável pela carga e organização dos dados: e a área externa, responsável pela apresentação dos dados ao usuário.

2.5  MODELO MULTIDIMENSIONAL

Um Data Warehouse é geralmente representado por um modelo multidimensional. Este modelo é mais simples para usuários comuns do que o modelo relacional comumente utilizado para sistemas do ambiente operacional [FELIPE, 02].

O modelo multidimensional possui três elementos básicos, que são:

a.     Fatos: são medidas de desempenho relativas ao assunto de negocio modelado.

b.     Dimensões: contextos de um fato.

c.     Medidas: Representações numéricas de um fato.

Assim, tomando o assunto “LIVRO” como exemplo, teríamos:

a.       Fato: Empréstimo.

b.      Dimensões: Tempo.

c.       Medidas: Quantos livros foram emprestados, valor total.

O usuário pode realizar algumas operações sobre o cubo, entre elas as seguintes:

a.      Drill-Down e Roll-up: respectivamente aumenta e diminui o nível de detalhamento de uma dimensão.

b.      Slice: Fatia o cubo. 

c.       Dice: é a junção de slices.

 

 

3      ARQUITETURA DE DATA WAREHOUSE PARA INSTITUIÇÕES DE ENSINO SUPERIOR

Fatores como custos operacionais, eficiência administrativa, qualidade do ensino e da pesquisa, retorno social realizado, passarão a comandar o planejamento quanto a tomada de decisão nas IES, VAHL [apud NEIVA, 89]. Portanto, existe a necessidade de uma arquitetura de produtos e serviços de tecnologia da informação que propicie a administração universitária usar de maneira eficiente todos os recursos e esforços existentes na instituição.

3.2  ESCOPO: TODA A ORGANIZAÇÃO

A arquitetura proposta tem por finalidade atingir toda a instituição. Apesar de ter-se a impressão de estar restrito apenas a uma parte da instituição, na medida em que o trabalho for se desenvolvendo, tem a perspectiva de abrangência de toda a instituição [CLEMES, 01].

3.3  TIPO DE DW: CENTRALIZADO

Inicialmente, por questão de facilidades como implementação, gerenciamento, performance nos procedimentos de extração e carga dos dados, e custos para implementação do ambiente, o DW deve ser centralizado [CLEMES, 01].

Entretanto, [KIMBALL, 98] afirma que os futuros data warehouses serão armazenados em varias máquinas com diferentes sistemas operacionais, utilizando diversos SGBDs. Segundo o autor, se o data warehouse for projetado corretamente, as várias máquinas compartilharão uma estrutura comum, com dimensões e fatos em conformidade, permitindo a fusão em um conjunto integrado. A arquitetura proposta permite essa descentralização.

 

3.4  MODELO DE DADOS: DIMENSIONAL COM ESQUEMA ESTRELA

Segundo KIMBALL (1998), a utilização do modelo dimensional tem várias vantagens sobre o modelo ER. Entre elas pode se destacar:

·        Geradores de relatórios, ferramentas de consulta e interfaces de usuários podem fazes fortes suposições sobre o modelo, tornando as interfaces mais compreensíveis e o processamento mais eficiente;

·        Mudanças no comportamento dos usuários não afetam os resultados obtidos, devido à estrutura previsível do modelo estrela;

·        Novos elementos podem ser facilmente adicionados, não sendo necessário mudanças nas consultas e nos relatórios existentes, nem recarga de dados.

3.5  GRANULARIDADE: NÍVEIS DUAIS DE GRANULARIDADE

A opção pelo uso de níveis duais de granularidade tem como finalidade baixos tempos de resposta nas consultas de níveis mais altos e permitir a análise dos dados em maior detalhe nos níveis mais baixos [CLEMES, 01].

3.6  PRODUTO FINAL

O resultado esperado é um conjunto de produtos, tecnologias e serviços, que possibilita a administração de uma instituição de ensino superior, a melhora no processo de tomada de decisão utilizando um ambiente integrado, independentemente de sua organização e de sua infra-estrutura [CLEMES, 01].

 

3.7  ROTEIRO PARA IMPLEMENTAÇÃO

Decidir pela implementação de um ambiente de data warehouse é uma tarefa tentadora. A obtenção de dados espetaculares e acessos as informações antes inimagináveis prometidas pelos fornecedores das soluções de DW, tornam seu uso quase obrigatório [CLEMES, 01].

            A maioria dos autores, entretanto, alerta para alguns fatores que devem ser considerados, antes e após, a implementação do ambiente de DW.

3.7.1        CONSIDERAÇÕES INICIAIS

·  Inicie o projeto com termino em mente, defina a arquitetura pretendida;

·  Construa o data warehouse incrementalmente;

·  Gerencie expectativas, ensine e treine os usuários no uso do DW;

·  Construa data marts dependentes: os data marts independentes serão os modernos sistemas legados.

3.7.2        PRÉ-CONDIÇÕES

Ambiente de hardware: definição dos equipamentos que irão suportar o armazenamento dos dados, principalmente a área do DW.

Ambiente de software: seleção do SGBD, ferramentas de extração, ferramentas de visualização, servidores OLAP e gerenciamento do ambiente.

Ambiente de comunicação: velocidade de comunicação é critica neste ambiente.

Pessoal técnico: são de suma importância na implementação dos diversos produtos que fazem parte da solução de DW. Domínio de sistemas operacionais, SGBDs, instalação de softwares e acesso os diversos sistemas legados.

Sistemas fontes: analise cuidadosa dos sistemas legados. A extração das informações desse ambiente costuma apresentar dificuldades extras.

3.7.3        PROJETO, CONSTRUÇÃO E IMPLEMENTAÇÃO

Identificação e documentação dos fatos em uma determinada área do negócio: consiste nos indicadores importantes para os tomadores de decisão.

Identificação e documentação das dimensões: durante o levantamento dos fatos, simultaneamente ocorre a identificação das dimensões. Definir o domínio dessas dimensões é uma tarefa critica, para permitir correta visualização dos indicadores.

Projeto físico das tabelas fatos e dimensões: a consolidação de tabelas fatos é uma tarefa importante nesta etapa, levando-se em consideração o nível granularidade e a semelhança entre os fatos.

Projeto e implementação das interfaces de extração, limpeza e carga dos fatos e dimensões: requer um árduo trabalho e envolvimento de pessoal técnico, principalmente de analistas e programadores que conhecem os sistemas transacionais, alem daqueles envolvidos na construção do DW. Muitos ajustes e retrabalho são necessários até que se consolidem os modelos de extração e carga dos dados.

Definição da próxima área da organização e repetição dos passos acima.

 

 

3.7.4        PÓS-CONDIÇÕES

·   Avalie constantemente a utilização e a satisfação dos usuários em relação ao ambiente de data warehouse;

·   Levante a necessidade de novas funcionalidades;

·   Avalie o desempenho e a qualidade das informações;

·   Mantenha os usuários atualizados e treinados na ferramenta;

·   Disponibilize novas funcionalidades e ferramentas permanentemente.

 

4   RESULTADOS

- Fazer um estudo aprofundado dos recursos existentes na organização, para utilizá-los na montagem de um ambiente de data warehouse [CLEMES, 01];

- Acesso padronizado e facilitado às informações existentes;

- Independência de pessoas/sistemas no fornecimento de informações;

- Confiabilidade das informações;

- Segurança no acesso as informações;

- Possibilidade do uso de um ambiente de data warehouse para o auxilio nos procedimentos de auditoria;

 - Rapidez no acesso e obtenção das informações, com redução dos prazos em dias para acessos em segundos;

- Necessidade do desenvolvimento e implementação de um ambiente de informações empresariais voltado para o ambiente das Instituições de Ensino Superior;

- Implantação de um organismo que avalie, estude, especifique e implante processos e métricas que melhores a qualidade de dados nos sistemas que dão suporte as atividades rotineiras da Instituição.

 

5        CONCLUSÕES

Um Data Warehouse é um banco de dados ou conjunto de banco de dados e ferramentas que tem por objetivo armazenar o histórico das operações de uma corporação para, através da análise desse histórico por um analista de negócio, permitir a identificação de tendências e auxiliar a tomada de decisão.

A arquitetura de um Data Warehouse deve ser planejado de acordo com cada tipo de negócio, para que os dados sejam utilizados de maneira eficiente.

Assim, a utilização de um ambiente de Data Warehouse em Instituições de Ensino Superior, mostra-se útil no suporte de Sistemas de Apoio a Decisão, prometendo ser promissora em outras áreas, como o de ambiente empresarial.

 

6 REFERÊNCIAS BIBLIOGRÁFICAS

 

BAKER, S.; BAKER, K. The best little warehouse in business. Journal of Business Strategy, v.20, n.2, 32-37, Mar/Apr., 1999.

 

BARBIERI, C. BI Business Intelligence. Rio de Janeiro: Axcel, 2001.

 

CAMPOS, M. L.; ROCHA FILHO, A. V. Data warehouse. Disponível em: <http://genesis.nce.ufrj.br/dataware/tutoria/home.html>. Acesso em: 08 jun. 2000.

 

 

COME, G. Contribuição ao Estudo da Implementação de Data warehouse: Um Caso no Setor de Telecomunicações: Dissertação (Mestrado) Universidade de São Paulo – Programa de Pós-Graduação em Administração, São Paulo, 1997. Disponível em <http://www.teses.usp.br/teses/disponiveis/ 12/12139/tde-19042002-183028>. Acesso em 11/04/2007.

 

CLEMES, Márcio, DATA WAREHOUSE COMO SUPORTE AO SISTEMA DE INFORMAÇÕES GERENCIAIS EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR: ESTUDO DE CASO NA UFSC, dissertação (mestrado), Universidade Federal de Santa Catarina – Programa de Pós-Graduação em Engenharia de Produção, Santa Catarina, 2001. Disponível em: teses.eps.ufsc.br/Resumo.asp?2985, Acesso em: 10/04/2007.

COMPUTER ASSOCIATES. São Paulo, v.2, edição especial, 1998.

FELIPE, Luiz, DATA WAREHOUSE, Curso de Pós-Graduação em Ciência da Computação, Rio Grande do Sul, 2002. Disponível em: www.inf.ufrgs.br/~clesio/cmp151/cmp15120021/apresentacao_lfelipegheller.pdf, acesso em 23/04/2007.

 

KIMBALL, Ralph; Reeves, Laura; Ross, Margy & Thornthwaite, Warren. The Data Warehouse lifecycle toolkit: expert methods for designing, developing, and deploying data warehouses. New York, John Wiley & Sons, 1998.

 

 

KUHNEN, Cleomir; Vieira, Valter, A. Vantagens obtidas com a utilização da implantação do Data Warehouse: Um estudo de caso na Unimed de Francisco Beltrão, Curso de Pós-Graduação em Administração, Universidade de São Paulo -USP, 2005, disponível em: www.ead.fea.usp.br/semead/8semead/resultado/trabalhosPDF/20.pdf., acesso em: 25/04/07.

 

 

INMON, W. H. Building the data warehouse getting started. Disponível em: <http://www.billinmon.com/library/library_frame.html>. Acesso em: 24/04/2007.

 

 

RELATÓRIOS sob medida. Information Week, São Paulo, v. 1, n. 1, p. 69, abr.1999.

 

 

REZENDE, D. A.; ABREU, A.F. Tecnologia da informação aplicada a sistemas de informação empresariais: o papel estratégico da informação e dos sistemas de informação nas empresas. 3ª. Edição. São Paulo: Atlas, 2003.

 

SCHLÖTTGEN, Alexandre. Estudo dos Aspectos Temporais de um Data Warehouse. PPGC, UFRGS, 2001.

 

SINGH, H. S. Data Warehouse. São Paulo: Makron Books, 2001. 382p.