XML Turbinado com Java - Explore a STaX, JAXB e outras APIs XML

Esse artigo faz parte da revista�Java Magazine edi��o 22. Clique aqui para ler todos os artigos desta edi��o

Aten��o: por essa edi��o ser muito antiga n�o h� arquivo PDF para download.Os artigos dessa edi��o est�o dispon�veis somente atrav�s do formato HTML.�

Byte Code

XML Turbinado com Java

Explore a STaX, JAXB e outras APIs XML

Conhe�a e compare t�cnicas modernas de processamento de XML com Java, incluindo binding, parsing e serializa��o de JavaBeans

Osvaldo Pinali Doederlein

A manipula��o de arquivos XML tornou-se parte rotineira do desenvolvimento de praticamente qualquer esp�cie de aplica��o. Essa tecnologia supre desde necessidades triviais, como substituir os velhos arquivos �properties� por formatos estruturados e valid�veis at� as mais avan�adas, como construir websites ultra-complexos, gerar relat�rios com sa�das em v�rios formatos (como HTML, PDF ou XLS), ou servir de base a um novo middleware, os web services.

Em todos esses casos, a tarefa essencial � processar arquivos XML. Na base da pilha de tecnologias de suporte a XML, encontramos os parsers, que d�o suporte a todos os componentes de mais alto n�vel � de facilidades gen�ricas de tratamento de XML como transforma��o XSL, a tecnologias mais complexas e especializadas como SOAP ou os descritores do J2EE. Uma falha ou problema de desempenho no parsing de XML ir� produzir uma falha ou problema de desempenho em todas as camadas superiores desta arquitetura. Por isso � essencial que a etapa de parsing seja executada de forma robusta e eficiente.

Este artigo faz uma revis�o das APIs de parsing de XML, sem tentar aprofundar-se em nenhuma delas: cada uma seria material suficiente para um artigo inteiro, e a JavaMagazine j� cobriu o assunto, por exemplo na Edi��es 2 (Processando XML com Java) e na Edi��o 9 (em v�rios artigos). Meu objetivo principal � apresentar as APIs mais recentes � a JAXB, StAX e Serializa��o XML de JavaBeans � que ainda s�o menos conhecidas e utilizadas. Al�m disso, fa�o um paralelo entre as v�rias op��es, discutindo diferen�as de desempenho, estilo e facilidade de programa��o.

Todo c�digo do artigo � compat�vel com o J2SE 1.4, sendo que os exemplos de StAX e JAXB necessitam do Java Web Services Developer Pack (JWSDP) vers�o 1.5.

A evolu��o do XML

O parsing b�sico de XML ainda n�o � um problema completamente resolvido, embora estejamos pr�ximos disso. O padr�o XML 1.0 (do W3C) foi publicado em 1998 e atualizado em fevereiro de 2004 com melhorias de pouca monta no suporte a Unicode e normaliza��o. H� poucos padr�es t�o importantes e t�o est�veis; esta estabilidade tem sido essencial ao sucesso do XML. Outros padr�es associados s�o um pouco mais recentes: XPath 1.0 (novembro/1999), XML Schema 1.0 (maio/2001), XSL (outubro/2001). H� novas vers�es dessas especifica��es em andamento, mas sem nada de revolucion�rio.

Os padr�es XML j� entraram em �modo legado�. A tecnologia � t�o amplamente utilizada, que ningu�m tem pressa de inventar nada radicalmente novo, nem � louco de quebrar compatibilidade com o que j� exista. � suficiente observar a lentid�o glacial que tem sido a transi��o do padr�o de valida��o de documentos de DTD para XML Schema. Muitos padr�es �de aplica��o� s� recentemente est�o migrando para Schemas. Por exemplo, o JavaServer Faces, apesar de bastante recente, ir� introduzir suporte a Schemas apenas na vers�o 1.2, que ainda est� em defini��o. E mesmo assim continuar� suportando DTDs para quem n�o tiver pressa de adotar a novidade. N�o deixa de ser surpreendente, considerando que o XML Schema est� dispon�vel e � bem suportado h� anos por diversos parsers. A JAXB, uma das APIs que veremos aqui, foi pioneira em exigir o uso de XSD, mas somente por absoluta necessidade. Como de costume o peso do legado � o pre�o do sucesso r�pido.

No universo Java a principal implementa��o dos padr�es fundamentais de XML � sem d�vida o parser Xerces (que implementa os padr�es XML 1.1, Namespaces 1.1, DOM Level2, SAX 2.0.1, Schema 1.0, JAXP 1.2), al�m do Xalan (que implementa XSL 1.0, XPath 1.0). Ambos s�o projetos da Apache Software Foundation. Esses parsers costumavam ser atualizados de poucos em poucos meses, mas desde fevereiro de 2004, com o Xerces 2.6.2 e Xalan 2.6.0, n�o houve mais nenhum release. Isso n�o significa que os desenvolvedores tenham abandonado os projetos: � apenas um sinal do grau de maturidade dos padr�es e suas implementa��es. O Xerces 2.7.0 est� em desenvolvimento e ir� suportar SAX 2.0.2, DOM Level3, XML Schema 1.1, XInclude 1.0 e JAXP 1.3, al�m de outras melhorias menores.

Parsing de XML em Java

Para testar as diversas APIs de parsing, vamos criar um documento XML bastante simples (mostrado na Listagem 1), que poderia ser usado para armazenar o sum�rio da Java Magazine, tal como aparece em javamagazine.com.br/edicoes/jm19 (veja a Figura 1). O documento utiliza alguns recursos essenciais de XML: tags aninhadas, atributos e texto interno. Para testar os parsers, vamos utilizar as classes Edicao e Secao, que encapsulam cada elemento deste arquivo (veja a Listagem 2).

Figura 1. P�gina de resumo da Edi��o 19 da Java Magazine: inspira��o para o exemplo de XML

�Listagem 1. Documento XML de teste

<?xml version="1.0"?>

<Edicao>

� <Secao nome="Editorial" autor="Leonardo Galv�o">

�� Na Edi��o 19 conhe�a os mecanismos do Struts para

�� criar a camada de visualiza��o de suas aplica��es com

�� ActionForms, DynaActionForms e valida��o...

� </Secao>

�

� <Secao nome="A Vida, o Universo e Tudo Mais"

�� titulo=" A Luta pelo Java Livre" autor="Bruno Souza">

�� Com o Tiger solto, como est� sendo tratada uma das

�� quest�es mais controversas da tecnologia Java?

� </Secao>

�

� <Secao nome="Byte Code" titulo="Matem�tica em Java"

�� autor="Osvaldo Pinali Doederlein">

�� Entenda e explore os recursos de matem�tica da J2SE,

�� tanto em ponto flutuante como n�meros decimais

� </Secao>

</Edicao>

�

Listagem 2. Mapeamento Java do documento XML

Edicao.java

�

import java.io.Serializable;

import java.util.ArrayList;

import java.util.List;

�

public class Edicao implements Serializable {

� private List secoes = new ArrayList();

�

� public List getSecoes () { return secoes; }

�

� public void setSecoes (List<Secao> secoes) {

�� this.secoes = secoes;

� }

�

� public void addSecao (Secao secao) {

�� this.secoes.add(secao);

� }

�

� public String toString () {

�� StringBuffer s = new StringBuffer();

�� for (int i = 0; i < secoes.size(); ++i)

�� s.append(secoes.get(i));

�� return s.toString();

� }

}

�

Secao.java

import java.io.Serializable;

�

public class Secao implements Serializable {

� private String nome;

� private String autor;

� private String texto;

� public Secao () {}

�

� public Secao (final String nome, final String autor,

�� final String texto)

� {

�� this.nome = nome; this.autor = autor; this.texto = texto;

� }

�

� public String getAutor () { return autor;� }

� public void setAutor (String autor) { this.autor = autor; }

� public String getNome () { return nome; }

� public void setNome (String nome) { this.nome = nome; }

� public String getTexto () { return texto; }

� public void setTexto (String texto) { this.texto = texto; }

� public String toString () {

�� return "nome=" + nome + ",autor=" + autor + "\n" + texto;

� }

}

Parsing com DOM

O DOM (Document Object Model, parte da JSR-5: JAXP � Java API for XML Parsing) � o mapeamento para Java do padr�o DOM Level 1 do W3C. O DOM � centrado em um modelo orientado a objetos representando o documento XML; o parser transforma o documento numa �rvore de �n�s� (nodes) que reproduz a estrutura de itens do documento.

No documento de exemplo a raiz desta �rvore � o Node do elemento <Edicao>, que possui uma NodeList contendo tr�s n�s para cada se��o; as se��es de texto interno a elementos s�o objetos TextNode. Podemos ver na Listagem 3 que o DOM permite escrever c�digo razoavelmente compacto. Mas a API deixa a desejar, pois foge completamente das normas de design de APIs do Java. Por exemplo, NodeList � uma cole��o totalmente ad hoc, n�o sendo compat�vel com java.util.List ou com qualquer interface padr�o de cole��es do Java. Al�m disso define m�todos estranhos, como getLength() ao inv�s de length() ou size(), e item() no lugar de get(). Essa esquisitice ocorre porque o DOM � um padr�o do W3C que pretende definir uma API independente de linguagem de programa��o, tanto que as classes e interfaces ficam em pacotes org.w3c.*.

�

Listagem 3. Parser DOM

import java.io.StringReader;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

�

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

import org.xml.sax.InputSource;

...

Quer ler esse conteúdo completo? Tenha acesso completo

Tecnologias:

Confira outros conte�dos:

Introdu��o ao JDBC

Novidades do Java

Teste unit�rio com JUnit

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Osvaldo Em 2008

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

XML Turbinado com Java - Explore a STaX, JAXB e outras APIs XML

Conhe�a e compare t�cnicas modernas de processamento de XML com Java, incluindo binding, parsing e serializa��o de JavaBeans.

Confira outros conte�dos:

Introdu��o ao JDBC

Novidades do Java

Teste unit�rio com JUnit

Perguntas frequentes

Nossos casos de sucesso