Manipulando modelos de dados lógicos e físicos a partir de arquivos XML

� comum na �rea de inform�tica nos depararmos com situa��es diversas onde o volume de tarefas � muito grande e tamb�m com tarefas espec�ficas que possuem um grande volume de trabalho, muitas vezes um trabalho repetitivo e moroso. Em outras situa��es existe o fantasma assustador da necessidade de mudan�a de ferramentas durante um processo de desenvolvimento ou manuten��o de software.

Muitos dos esfor�os na engenharia de software se dirigem � constru��o de ferramentas de apoio �s tarefas comuns nessa �rea, como, modelagem, desenvolvimento, manuten��o e documenta��o. Para aproveitar melhor as funcionalidades oferecidas por essas ferramentas � interessante ter a possibilidade de trocar informa��es entre elas. Assim, v�rias ferramentas independentes podem ser usadas em conjunto para formarem um poderoso ambiente de desenvolvimento/manuten��o. Tamb�m � importante a possibilidade de migrar entre ferramentas diferentes com o m�nimo impacto poss�vel, mesmo que seja a migra��o de uma vers�o da ferramenta para uma mais atual.

Para conseguir essa troca de informa��es, foram desenvolvidas v�rias linguagens comuns que toda ferramenta poderia interpretar. Essas linguagens permitem salvar os dados em uma ferramenta e ler esses mesmos dados dentro de uma outra ferramenta. Uma dessas linguagens, que est� ganhando muito apoio, � a XMI (XML Metadata Interchange) definida pela OMG (Object Modeling Group).

Podemos considerar que arquivos XML nada mais s�o que arquivos de texto formatados com base em um padr�o definido, o DTD (Document Type Definitions), mesmo quando usados para compor um poderoso ambiente de desenvolvimento e manuten��o. Os arquivos XML podem ser visualizados e manipulados at� nos mais simples editores de texto dispon�veis, onde podemos nos utilizar de express�es regulares ou ent�o percorrer estes arquivos com simples programas desenvolvidos com Java ou macros.

XMI � um exemplo pr�tico dos benef�cios da padroniza��o XML. Adotando XML como uma tecnologia base, as empresas podem dar maior aten��o para os seus pr�prios produtos, dando maior �nfase ao neg�cio da sua empresa, mesmo que este n�o seja o desenvolvimento de software, confiando que um canal de comunica��o por meio de XML possibilitar� a eles conectar-se a processos e obter dados de outras empresas. Padr�o XMI XMI � uma especifica��o XML para representa��o de modelos criada com o objetivo de permitir a interoperabilidade entre ferramentas de modelagem, reposit�rios de metadados e outras ferramentas de desenvolvimento.

O XML Metadata Interchange Format � XMI � � uma especifica��o mantida pelo Object Modeling Group (OMG) e consiste basicamente de um modelo aberto de troca de informa��es que permite aos desenvolvedores, que trabalham com tecnologia de objetos, a troca de dados de um modo padronizado. Entre outros benef�cios, todos ganham em consist�ncia e compatibilidade nas aplica��es constru�das em ambientes colaborativos. Isto ocorre em muitos projetos Open Source, por exemplo. O XMI foi constru�do a partir de uma combina��o de UML (Unified Modeling Language) usada para descrever o meta modelo, an�lise e design, XML (eXtensible Markup Language), usado para sintaxe e encoding e MOF (Meta Object Facility) (usado para defini��es de metadados e gerenciamento).

Por ser um padr�o que busca facilitar o intercambio de informa��es entre diferentes ferramentas, o XMI se torna um mecanismo de suporte a modelos e modelagem a ser utilizada por designers e implementadores.

Um exemplo a ser utilizado para migra��o de modelos pode ser visto na Figura 1.

**Figura 1**. Passos na migra��o de um modelo entre duas ferramentas diferentes. Ambas devem ter suporte a importa��o e exporta��o por XMI.

Nem todas as ferramentas de modelagem gratuitas disponibilizam este recurso, mas a maioria das ferramentas comerciais como o Together e as vers�es posteriores � vers�o 2003 do Rational Rose j� disponibilizam. No entanto, para o Rational Rose ser� necess�rio instalar um add-in para que ele tenha essa op��o dispon�vel.

XMI e MOF s�o fundamentais para as ferramentas IBM voltadas para o desenvolvimento de software. O padr�o XMI j� esta sendo tamb�m utilizado em ferramentas de integra��o e data warehouses. At� mesmo a Microsoft j� se rendeu ao XMI. O componente de exporta��o de XMI pode exportar um modelo UML desenvolvido com Microsoft� Visio� 2003 para um arquivo XML dentro dos padr�es XMI. Os elementos UML suportados incluem a maioria das estruturas est�ticas: classes e diagramas.

Aplica��es de terceiros podem acessar as propriedades dos elementos UML atrav�s da leitura e interpreta��o dos dados dos arquivos em formato XMI. Pelo fato destes arquivos utilizarem o XML, qualquer aplica��o que seja capaz de interpretar um XML pode ser utilizada.

Exemplo pr�tico com um grande modelo de dados

Este exemplo trata da constru��o de um grande modelo dimensional (ler Nota 1), a ser desenvolvido em um curto espa�o de tempo, cerca de tr�s semanas. O principal objetivo era ter o modelo f�sico pronto no prazo especificado para o in�cio da implementa��o.

Este modelo possu�a aproximadamente 70 tabelas, algumas com at� 256 campos. O processo de cria��o e desenvolvimento do modelo envolveu um analista de dados que registrou na ferramenta de modelagem o que fora definido pelo desenvolvedor. Tamb�m participou do processo um DBA, mas de forma bastante restrita. No total foram cerca de 4500 campos em 72 tabelas.

Nota: Modelo Dimensional

Modelos desenvolvidos para suportar Data Warehouses ou Data Marts nos quais as informa��es s�o apresentadas como cubos, formados por v�rias dimens�es. Cada dimens�o representa uma perspectiva na qual os dados podem ser analisados. H�, em um modelo dimensional, dois tipos de objetos: fatos e dimens�es. Os fatos representam as medi��es num�ricas do neg�cio e as dimens�es, representam as descri��es das dimens�es do neg�cio. Algumas autoridades no assunto, como Ralph Kimball, defendem a utiliza��o da modelagem dimensional em rela��o � modelagem de Entidades-Relacionamentos (ER). O argumento � a do destaque �s entidades mais importantes e a evid�ncia de onde est�o os valores num�ricos do neg�cio e onde est�o armazenadas as informa��es descritivas.

O processo utilizado para isto determina que o modelo de dados seja criado seguindo os padr�es de nomenclatura definidos pela empresa, onde � necess�rio ter cada campo bem documentado e tamb�m o modelo l�gico correspondente.

O uso de padr�es de nomenclatura � fundamental neste processo, pois se cria uma cultura nos usu�rios deste modelo que posteriormente facilita a identifica��o da informa��o, principalmente num modelo dimensional onde v�rios usu�rios t�m acesso para a cria��o de seus relat�rios.

� importante ressaltar que a documenta��o de um modelo dimensional n�o se resume em apenas dizer o que o campo armazena. Tamb�m s�o necess�rios exemplos de dados que ele pode conter e o detalhamento da exist�ncia de relacionamentos em caso de chaves prim�rias e estrangeiras. Esta documenta��o deve detalhar a informa��o, de onde v�m, para onde vai, do que � formada e se � relativa a um per�odo do ano, entre outras.Um modelo dimensional para Data Warehouse normalmente cont�m uma grande quantidade de indicadores que s�o respons�veis por dar embasamento para decis�es estrat�gicas. Este modelo deve ter uma documenta��o adequada e completa, um dicion�rio de dados que tenha conte�do significativo. N�o devem ser aceitos relatos do tipo �c�digo do produto, gerado automaticamente� para descrever um campo chave. Num modelo dimensional, o m�nimo que se espera da documenta��o de um campo chave seria algo como: �c�digo do produto disponibilizado para comercializa��o, importado do sistema de CRM por um processo mensal de carga de dados. Este c�digo � gerado automaticamente pelo sistema de faturamento e � formado por c�digo da empresa distribuidora + n�mero sequencial+ ano corrente. N�o poder� ser utilizado como identificador �nico, somente ser� representativo quando utilizado junto com o identificador da empresa distribuidora. Indica...�.

Num primeiro momento foi criada toda a documenta��o e tamb�m a padroniza��o de nomes, mas o modelo l�gico n�o foi gerado. Para a entrega do trabalho dentro das 3 semanas estipuladas, o modelo l�gico tamb�m era artefato obrigat�rio e precisaria ser criado.

Inicialmente, foi feita uma an�lise para tentar reduzir ao m�ximo o trabalho manual, tentando automatiz�-lo. A informa��o inicial de como deveria ser o modelo estava em diversas planilhas eletr�nicas. Inicialmente, foi necess�rio um trabalho manual de percorrer todos os dados das planilhas para fazer a atribui��o de nomes e complementar a documenta��o geral dos campos, a dicionariza��o. Foram 4500 campos revisados, pois cada caso deveria ser analisado individualmente e para algumas situa��es ajudou o velho e bom buscar/copiar/substituir. Ap�s este trabalho, as planilhas foram importadas para o Microsoft Access, um grande companheiro para estas atividades, e a partir dele foram criadas as consultas que geraram a DDL(Data Definition Language) do modelo final.

A DDL foi carregada na ferramenta usada para a modelagem, o ERWin. Esta ferramenta n�o disponibiliza suporte para a gera��o de arquivos XMI na vers�o utilizada, infelizmente. Ap�s 3 semanas de trabalho, o modelo f�sico estava pronto, com os devidos relacionamentos criados. A partir deste ponto, o dicion�rio de dados j� poderia ser gerado a partir das consultas criadas na ferramenta Microsoft Access. Faltava ainda o modelo l�gico. N�o havia o prop�sito de manipular nenhuma entidade no modelo l�gico, mas havia a necessidade de document�-lo e renomear as entidades e atributos. Mas ainda faltava neste modelo l�gico um grande trabalho para atribuir o nome l�gico de cada tabela e campo � documenta��o que estava nas planilhas eletr�nicas.

Se feito manualmente, este trabalho levaria mais algumas semanas e n�o t�nhamos este tempo. Ap�s algum tempo de investiga��o descobrimos que a ferramenta ErWin suportava a gera��o de arquivos XML, num formato propriet�rio mas facilmente reconhecido. Procurei logo o DTD do XML gerado e identifiquei que seria poss�vel manipular o XML sem perder a formata��o, os diagramas criados e as cores do modelo.

O pr�ximo passo foi identificar as tags do arquivo XML que continham o nome f�sico e o nome l�gico de cada entidade e demais atributos que deveriam ser substitu�dos ou preenchidos. O XML utilizado neste caso de estudo tinha cerca de 4 Megabytes de informa��o. Foi extra�da uma parte deste arquivo o qual pode ser visualizado na Listagem 1.

**Listagem 1**. Exemplo de conte�do de um arquivo XML gerado pela ferramenta ErWin

Em seguida desenvolvemos um programa para a manipula��o dos dados. Este programa poderia ter sido feito em qualquer linguagem de programa��o, mas a escolhida foi Java em fun��o da familiaridade que a equipe possu�a com esta linguagem e pelas facilidades que ela disponibiliza na manipula��o de arquivos, em especial arquivos XML.

Basicamente, o programa l� o arquivo XML buscando pelas tags que delimitam os trechos a serem substitu�dos e faz a substitui��o pelo nome ou conte�do necess�rio, o qual estava em um outro arquivo XML gerado a partir da consolida��o das planilhas do Microsoft Excel. A partir da manipula��o dos dados dos arquivos XML, o trabalho de semanas foi executado em cerca de 3 dias.

O exemplo citado foi apenas uma poss�vel situa��o de utiliza��o de arquivos XML, mas podemos utiliz�-los para diversos outros fins. E com a evolu��o do padr�o XMI, esta utiliza��o tende a crescer ainda mais. Imagine a situa��o de uma troca de padr�o de nomes, ou o caso em que deva ser trocado o tipo de dados de um grande n�mero de campos, este mesmo processo poderia ser utilizado. Importante ressaltar, nem o ERWin nem o Rational Rose possuem recurso para buscar/substituir nomes ou tipo dos dados. E existe um grande n�mero de modelos desenvolvidos nestas ferramentas, principalmente no ERWin.

Um outro recurso muito interessante de arquivos XML � o fato de que ele pode ser visualizado em qualquer editor de textos ou em browsers, os quais at� fazem verifica��es da integridade do arquivo com base no DTD especificado. Al�m de disponibilizar uma visualiza��o do arquivo amig�vel conforme mostrado na Figura 2.

**Figura 2**. Visualiza��o de um arquivo XML por meio de um Browser

Conclus�es

Procurei, neste artigo, colocar algumas sugest�es de como podemos agilizar a execu��o di�ria de tarefas que normalmente exigiriam um trabalho muito mais mec�nico. Este ganho de tempo � conseguido com a manipula��o de arquivos XML que podem ser gerados pelas ferramentas encontradas atualmente no mercado. Este artigo procurou mostrar uma abordagem inovadora para problemas de manipula��o de grandes volumes de dados: se voc� se deparar com uma situa��o onde a tarefa seja altamente mec�nica, mantenha a calma, e com calma, identifique as op��es dispon�veis para automatizar a tarefa. Este tempo para pesquisas normalmente permitir� que o trabalho seja feito em menos tempo e com um menor n�mero de erros.

Outra utiliza��o interessante para este padr�o � a possibilidade de mudar ou atualizar as ferramentas de modelagem na sua empresa com o m�nimo de impacto. Modelos podem ser facilmente convertidos para o padr�o XMI e em seguida podem ser importados pela nova ferramenta. Existem at� mesmo algumas ferramentas que fazem a transforma��o de modelos em formato XMI, modelos estes criados em ferramentas que n�o disponibilizam essa op��o XMI.

Tecnologias:

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Juliana Em 2008

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Manipulando modelos de dados l�gicos e f�sicos a partir de arquivos XML

Veja neste artigo como manipular modelos de dados l�gicos e f�sicos a partir de um arquivo de arquivos XML.