Integrando o ERwin ao SGBD Adabas - Parte 01

Integrando o ERwin ao SGBD Adabas - Parte 01

Design em Camadas das Estruturas de Dados

por Gustavo Aguilar de Ara�jo

Desde os prim�rdios dos sistemas computacionais baseados em banco de dados, os modelos de dados constituem um recurso poderoso para a documenta��o e para o projeto das estruturas de armazenamento das informa��es. Em um primeiro momento, o Modelo de Entidades e Relacionamentos (Modelo ER), concebido com base nas regras de neg�cio e requisitos de informa��es levantadas, prov� o entendimento do �problema� e do seu respectivo contexto. Posteriormente, este modelo � utilizado para a gera��o do Modelo de dados L�gico (Relacional), onde deve-se considerar as particularidades do Sistema Gerenciador de Banco de Dados (SGBD). Por conseguinte, o modelo l�gico � utilizado para a cria��o do esquema f�sico no banco de dados.

Avaliando rapidamente este fluxo, fica clara a necessidade de uma ferramenta que automatize e integre as v�rias etapas deste processo de Modelagem em Camadas das Estruturas de Dados, pe�a fundamental no ciclo de desenvolvimento de sistemas baseados em banco de dados. No aspecto tocante a modelagem de dados, existem ferramentas CASE que prov�em tal agilidade e integra��o. Apesar de CASE (Computer Aided Software Engineering) significar engenharia de software apoiada por computador, as ferramentas CASE s�o largamente utilizadas em projetos de banco de dados. Neste sentido, deve-se dar prefer�ncia por ferramentas case de modelagem de dados que permitem ao usu�rio criar o modelo ER, criar o modelo de dados l�gico, bem como gerar os respectivos scripts para a cria��o f�sica dos objetos no SGBD definido para o projeto.

A escolha do SGBD mais adequado para um determinado projeto n�o � uma tarefa f�cil, pois ele deve adequar-se n�o s� tecnicamente e funcionalmente, mas tamb�m comercialmente. As op��es s�o in�meras. Atualmente, existe uma abund�ncia de SGBD�s dispon�veis no mercado, sejam eles gratuitos ou comerciais, cada um com seu(s) prop�sito(s), limites, caracter�sticas e aplicabilidade. A lista � extensa, contendo SGBD�s populares como Oracle, SQL Server, MySQL, Sybase, PostgreSQL, Firebird, SGBD orientado a objetos como o Cach� da InterSystems, banco de dados XML como o Tamino da Software AG, SGBD�s voltados para Data Warehouse, como o Teradata, bancos de dados para mainframe como o ADABAS, tamb�m da Software AG, e o DB2 da IBM, dentre outros.

Avaliando esta lista de SGBD�s, imagina-se tamb�m o desafio para desenvolver uma ferramenta case que d� suporte a todos eles. Desafio t�o grande, que super�-lo se torna uma tarefa muito invi�vel, mas n�o imposs�vel. Invi�vel do ponto de vista t�cnico, dadas as particularidades de cada SGBD e das suas respectivas vers�es; do ponto de vista da manuten��o da ferramenta diante da complexidade da solu��o, do vasto conhecimento necess�rio nos diversos SGBD�s pelos profissionais desenvolvedores, e da possibilidade do surgimento de novos SGBD�s. Invi�vel tamb�m do ponto de vista comercial, pois seria uma ferramenta cara, dado o alto custo de desenvolvimento.

Avaliando o conjunto de ferramentas case existente e suas particularidades, conclui-se que em raras situa��es, os fabricantes optam por construir uma ferramenta case propriet�ria, ou seja, espec�fica para um determinado SGBD. Neste segmento, est�, por exemplo, o Oracle Designer da Oracle.

Na tentativa de evitar um alto custo de desenvolvimento, e tentando atingir o maior n�mero de usu�rios poss�veis, os fabricantes adotam determinada estrat�gia onde elege-se os principais SGBD�s da atualidade e desenvolve-se uma ferramenta case nativamente compat�vel com estes bancos de dados. Neste ramo est�o, por exemplo, o AllFusion ERwin Data Modeler da Computer Associates, o Power Designer da Sybase, o System Architect da Popkin Software, Case Studio da Charonware, o ER Studio da Embarcadero Technologies, etc. No entanto, esta estrat�gia pode ser um problema para o usu�rio, pois o que fazer quando a ferramenta case n�o d� suporte � todos os bancos de dados utilizados na empresa?

Nesta situa��o, considerando que seja primordial uma integra��o entre a ferramenta case e o SGBD, pode-se dizer que existam basicamente quatro op��es:

1) Adquirir outra ferramenta case compat�vel com o SGBD em quest�o: implica em custos na aquisi��o de uma nova ferramenta e treinamento, al�m de dificultar a manuten��o dos padr�es, metodologias e modelos de dados da empresa com a exist�ncia de duas ferramentas case corporativas;

2) Solicitar ao fabricante da ferramenta o desenvolvimento da interface nativa com o SGBD desejado: nem sempre � interesse do fabricante desenvolver esta interface, ficando a resolu��o do problema dependente de outros fatores n�o t�cnicos, como os j� citados na inviabilidade para a constru��o da ferramenta case que suporte todos SGBD�s;

3) Substituir o SGBD n�o suportado: pode implicar em um grande investimento para migrar o banco de dados e alterar os sistemas que acessem este SGBD;

4) Utilizar recursos da ferramenta case que viabilizem a integra��o com o SGBD em quest�o: requer um conhecimento avan�ado da ferramenta case, e pode necessitar de uma pequena camada de aplica��o entre o banco de dados e a ferramenta case para prover a integra��o. Tamb�m gera custos, mas de menor grandeza, pois n�o envolve compra de uma nova ferramenta case.

Neste artigo, ser� mostrada a aplicabilidade da quarta op��o, onde viabiliza-se a integra��o entre a ferramenta case AllFusion ERwin Data Modeler (vers�o 4.1.4) e o SGBD ADABAS (vers�o 7.4.2) para mainframe, que n�o � suportado nativamente pelo ERwin.

O ERwin � uma ferramenta case espec�fica para modelagem de dados relacional ou dimensional, fornecido pela Computer Associates. No portal da SQL Magazine (//www.devmedia.com.br/visualizacomponente.aspx?comp=1802&site=2), est� dispon�vel um artigo que fornece uma vis�o geral do ERwin. J� o ADABAS (ADAptable data BASe) � um banco de dados multi-thread de alta performance, escalabilidade e disponibilidade, produzido pela Software AG (http://www.softwareag.com) e distribu�do no Brasil pela Consist (http://www.consist.com.br).

Para demonstrar esta integra��o, ser�o expostas funcionalidades avan�adas do ERwin, conceitos b�sicos do banco de dados ADABAS e de algumas tecnologias utilizadas no processo de comunica��o entre as plataformas distribu�da e mainframe. O foco n�o � detalhar os programas que participam do processo, mas simplesmente demonstrar a possibilidade de se criar uma solu��o de modelagem de dados completa para sistemas mainframe baseados em ADABAS utilizando o ERwin, bem como servir de refer�ncia para situa��es problem�ticas semelhantes, onde h� um SGBD n�o suportado por determinada ferramenta case.

Esta solu��o tem como princ�pio b�sico o conceito de design em camadas, contemplando desde a modelagem conceitual at� a cria��o f�sica dos objetos. Tem como objetivo fornecer agilidade, qualidade, integridade e interliga��o das etapas de um projeto de banco de dados.

A solu��o foi concebida e especificada pela Administra��o de Dados do Grupo Telemar, implementada em parceria com a Consist Brasil, com o apoio t�cnico da equipe de Administra��o de Banco de Dados ADABAS, tamb�m do Grupo Telemar. De uma forma geral, a solu��o consiste basicamente em criar o modelo ER no ERwin, derivar o modelo relacional a partir deste modelo, e utilizar o processo de integra��o e convers�o para criar o esquema f�sico no banco de dados. A Figura 1 mostra este processo de uma forma macro.

Figura 1. Vis�o macro do processo de modelagem de dados para banco de dados Adabas com o ERwin.

Estudo de Caso

Para auxiliar no desenvolvimento do assunto, ser� feito um pequeno estudo de caso baseado em um sistema para controle de uma biblioteca. Para simplificar, neste sistema, deseja-se apenas:

- Cadastrar os usu�rios da biblioteca com os telefones para contato;

- Cadastrar as obras dispon�veis para empr�stimo (livros e artigos) e seus respectivos exemplares e edi��es;

- Cadastrar o assunto da obra (no m�ximo 3);

- Cadastrar o(s) autor(es) e editoras das obras;

- Registrar os empr�stimos e devolu��es das obras;

- Registrar reservas de obras (limite de 5 reservas ativas para um mesmo usu�rio);

- Consultar a situa��o dos exemplares existentes.

Primeira Etapa � A Cria��o do Modelo de Entidades e Relacionamentos

O ERwin permite criar tr�s tipos de modelos de dados: Logical Model, que possibilita a cria��o do modelo de entidades e relacionamentos; Physical Model, que possibilita a cria��o do modelo relacional espec�fico para um determinado SGBD; e o Logical/Physical, que possibilita a cria��o conjunta, em um mesmo modelo do ERwin, do modelo ER e do Relacional. Apesar dos dois primeiros tipos de modelos serem criados separadamente, eles podem ser sincronizados utilizando-se os recursos de design em camadas existentes no ERwin.

Para demonstrar a viabilidade do design em camadas no ERwin, foi criado inicialmente, um modelo de dados ER no ERwin do tipo logical model, mostrado na Figura 2. Nesta primeira etapa, � fundamental abstrair as reais necessidades do usu�rio n�o preocupando-se em nenhum momento com os detalhes de implementa��o f�sica do modelo de dados. Deve-se definir as entidades necess�rias, os relacionamentos existentes entre elas, os atributos das entidades, o dom�nio dos atributos (string, num�rico, data, etc.), sem esquecer da documenta��o da funcionalidade de cada componente do modelo.

OBS: quando se trabalha com o ERwin, � importante n�o confundir seu �Logical Model� com o conceito de Modelo L�gico Relacional da Teoria de Banco de Dados.

Figura 2. Modelo de Entidades e Relacionamentos para o Sistema de Biblioteca proposto.

Finalizado o modelo ER, passamos ent�o para a pr�xima etapa, onde � constru�do o modelo relacional considerando-se as peculiaridades do SGBD escolhido. Para isto, alguns conceitos b�sicos sobre o ADABAS tornam-se necess�rios.

Conceitos B�sicos do ADABAS

O ADABAS (ADAptable data BASe), como o pr�prio nome sugere, � um SGBD adapt�vel � estrutura de modelo de dados que deseja-se implementar. Dentre elas, podemos citar a estrutura relacional, hier�rquica, geogr�fica ou de rede.

Como todo SGBD, o ADABAS possui um Dicion�rio de Dados, chamado Predict, onde s�o armazenados os metadados, ou seja, as informa��es acerca dos objetos criados, tais como o nome do objeto, o tipo de dados dos campos, a descri��o dos campos, etc.

Na solu��o apresentada, toda interface com o ADABAS ser� feita atrav�s do seu dicion�rio de dados. Isto implica que, antes do objeto ser implementado fisicamente no SGBD, ele ser� criado primeiramente no Predict. Assim sendo, algumas etapas da solu��o desenhada fazem men��o ao Predict, visto que, estando o objeto criado no dicion�rio de dados, sua gera��o f�sica no ADABAS se torna trivial.

No ADABAS, existem dois tipos principais de estruturas de armazenamento e acesso a dados: Files e Userviews. Files (ou arquivos) s�o estruturas tabulares, an�logas ao conceito de tabelas em outros SGBD�s, para armazenamento de registros (linhas de dados). Estes files s�o compostos por um ou mais Field (campo ou coluna), cada um com seu respectivo Datatype (tipo de dados). J� a userview, tem como objetivo restringir o acesso de um determinado usu�rio aos campos de um determinado file, ou seja, trata-se de uma camada l�gica de acesso ao file, uma vis�o do usu�rio. A Figura 3 ilustra a id�ia destes 2 tipos de objetos.

Figura 3. Files e Userviews.

Para determinar o tipo do objeto, ou seja, se ele � um file ou uma userview, o Predict utiliza uma propriedade denominada Type. Um objeto do tipo file, possui type igual a Adabas file. Uma userview possui esta propriedade igual a Adabas userview. Al�m desta, um file Adabas possui v�rias outras propriedades, tais como:

- File ID: nome do file que identifica unicamente o objeto no Predict, limitado a 32 caracteres.

- Abstract: descri��o resumida do file, com no m�ximo 480 caracteres, geralmente utilizada para descrever brevemente a funcionalidade de um determinado file.

- Extended Description: descri��o extensa do file, armazenando mais de 20.000 caracteres. Utilizada para descri��es maiores e mais detalhadas da funcionalidade de um determinado file.

- Database: banco de dados onde o file est� criado. Uma instala��o do ADABAS (vers�o 7.4.2) permite a cria��o de at� 65.535 bancos. Cada banco pode ter at� 5.000 files, e � identificado fisicamente por um n�mero (PDBnr � physical database number).

- File number: n�mero do file, que o identifica de forma �nica em um determinado database.

- Owner: propriet�rio do file. Pode ser um usu�rio, um departamento, etc.

- Keyword: palavra chave do file. A utiliza��o deste recurso � bem ampla, mas pode ser utilizado por exemplo, para informar � qual(is) sistema(s) um determinado file pertence.

J� as userviews, s�o criadas a partir de um file Adabas, que neste contexto denomina-se Master file da userview. Com exce��o da propriedade file ID, que deve ser o nome �nico da userview, as demais propriedades (database, file number, abstract, extended description, owner e keyword) s�o herdadas do master file. Dentre estas propriedades, database e file number devem ser obrigatoriamente iguais aos do master file. As demais podem ser customizadas diretamente na userview.

Para criar um bom modelo de dados l�gico para o ADABAS, deve-se conhecer tamb�m os tipos de campos que um file/userview pode ter e suas caracter�sticas fundamentais. Assim como em outros SGBD�s, um campo possui um nome (Field ID), possui um formato (Field Format) para os dados (alfanum�rico, bin�rio, decimal, float, etc.) e tamanho m�ximo (Length) aceito pelo campo. Al�m destas propriedades b�sicas, tamb�m deve-se definir as seguintes caracter�sticas de um campo de file Adabas/userview:

- Field Type (Ty): especifica o tipo do campo (n�o confundir com Field Format, que � o tipo de dados aceito pelo campo). Os tipos mais utilizados s�o:

� Normal field: tamb�m chamado de campo elementar (Elementary Field), � utilizado nos casos onde n�o necessita-se do comportamento provido pelos demais tipos, como mostra a Figura 4.

� Group (GR): campo grupo, que permite agrupar um conjunto de campos. Para endentar este agrupamento, utiliza-se a propriedade Field Level (L), que informa o n�vel do campo. Com isto, o campo grupo possuir� n�vel sempre maior do que o n�vel dos campos que o comp�e. Na pr�tica, quando selecionamos o campo grupo, s�o exibidos os valores dos campos que o comp�em. A Figura 4 mostra um exemplo de um campo do tipo grupo.

OBS: � permitido definir grupos com at� sete n�veis.

� Multiple Value Field (MU): campo m�ltiplo que repete determinado n�mero de vezes para um mesmo registro (linha) do file. Fazendo uma analogia, este campo representa um relacionamento 1xN dentro de cada registro de um mesmo file, ou seja, trata-se de uma desnormaliza��o onde n�o h� a necessidade de se repetir a linha toda para cada valor do campo repetitivo. A Figura 4 mostra um exemplo de um campo do tipo m�ltiplo.

� Periodic Group (PE): grupo peri�dico que une os conceitos de grupo e m�ltiplo, permitindo que um conjunto de campos ocorra determinado n�mero de vezes para um mesmo registro do file.

Figura 4. Tipos de campos elementar, grupo, m�ltiplo e grupo peri�dico.

� Superfield (SP): �super-campo�, que permite criar um campo composto por outros campos e/ou partes de outros campos. � sempre composto por no m�nimo dois campos ou duas partes de campos.

� Subfield (SB): �sub-campo�, que permite criar um campo composto por um campo ou por uma parte de um campo.

As demais propriedades de um field s�o:

- Occ (N�mero de Ocorr�ncias): propriedade de campos m�ltiplos e de grupos peri�dicos que informa a quantidade de vezes que o campo se repete para um �nico registro do file. O valor m�ximo na atual vers�o, � de 191 ocorr�ncias.

- Unique Option (U): propriedade que indica a unicidade dos valores do campo.

- Field Suppression(S): serve para indicar a op��o de compress�o do campo ou para indicar a representa��o de campo nulo ou requerido (campo NOT NULL). Esta propriedade visa a otimiza��o da utiliza��o do espa�o em disco consumido pelo campo.

- Short Name(DB): nome f�sico do campo utilizado internamente pelo ADABAS para acess�-lo. Este nome trata-se de um valor alfanum�rico de 2 posi��es, sendo que de E0 at� E9 s�o short names reservados para uso do banco. Este short name n�o se repete dentro de um mesmo file.

- Descriptor Type(D): campos que possuem esta propriedade igual a D Descriptor/Index funcionam como campos descritores, que nada mais s�o que �ndices simples de pesquisa. Para definir um �ndice composto de pesquisa, ou um �ndice de pesquisa composto de parte(s) de campo(s), utiliza-se a combina��o desta propriedade com a propriedade field type (SP ou SB), permitindo-se criar campos superdescritores ou subdescritores.

� Superdescritor: Superfield + Descritor. Este tipo de campo possui a propriedade field type igual a SP e a propriedade descriptor type igual a D.

� Subdescritor: Subfield + Descritor. Este tipo de campo possui a propriedade field type igual a SB e a propriedade descriptor type igual a D. Composto por apenas um campo ou apenas uma parte de um campo.

OBS: os campos que s�o apenas superfield ou subfield e que n�o s�o descritores, n�o podem ser utilizados como crit�rio de busca.

De posse destes conceitos b�sicos, ficar� plaus�vel o entendimento da solu��o dada para o modelo de dados l�gico do Sistema de Controle de Biblioteca proposto, tendo como foco o SGBD ADABAS.

Confira outros conte�dos:

Por Gustavo Em 2008

Integrando o ERwin ao SGBD Adabas - Parte 01

Veja como integrar o ERwin ao SGBD Adabas.

Confira outros conte�dos: