Manipulando arquivos XML em Java

Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

Dessa vez trago para voc�s um guia r�pido com as principais funcionalidades da API Java 1.5 para manipular arquivos XML. Gostaria inicialmente de deixar claro que este tutorial n�o tem o prop�sito de ensinar conceitos de XML. Portanto, nos pr�ximos par�grafos estarei assumindo que voc� j� tem conhecimento sobre o referido t�pico. Esse artigo � dividido em quatro se��es. A primeira mostra um mapeamento entre elementos de um arquivo XML e classes em Java. A segunda ensina como transformar um arquivo XML em disco num objeto de manipula��o em Java (parsing). Vamos fazer uma breve explana��o sobre os principais m�todos de acesso a dados j� em mem�ria na se��o 3. E, finalmente, iremos mostrar como fazer consulta a documentos XML na se��o 4.

Representa��o de elementos XML

A fim de facilitar o entendimento desta se��o, vamos utilizar o documento XML abaixo e ilustrar a partir dele como � feita a representa��o de cada elemento ap�s ele ser carregado em mem�ria atrav�s do parsing (explicado na se��o seguinte).

Listagem 1 � Exemplo de um arquivo XML.


<html>

    <head>

                   <title>Título</title>

    </head>



    <body onload="javascript:alert('Olá!')">

                   <p>Olá Mundo!</p>

    </body>

</html>

Todo o documento acima e informa��es de controle interno como codifica��o do texto s�o mapeados e acessados atrav�s da interface org.w3c.dom.Document. Ou seja, idealmente ap�s fazer o parsing teremos um objeto que implementa essa interface, que � a vis�o mais �macro� de um arquivo XML em mem�ria.

Numa vis�o mais detalhada do arquivo, temos a introdu��o de conceitos como Node, Element, Attr e Text, todos do pacote org.w3c.dom. Tanto o elemento Document quanto o Element, Attr e Text herdam da interface Node, ou seja, todos esses elementos s�o vistos como sendo n�s da �rvore XML.

Parsing

Uma das maneiras de se realizar o parsing de um arquivo XML � atrav�s do m�todo parse(File f) da classe javax.xml.parsers.DocumentBuilder. Veja o trecho de c�digo abaixo que mostra como se obter um Document atrav�s de um arquivo em disco:

Listagem 2 � Carregando um documento de um arquivo.


DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

dbf.setNamespaceAware(false);

DocumentBuilder docBuilder = dbf.newDocumentBuilder();

Document doc = docBuilder.parse(new File("arquivo.xml"));

Para que o parsing suporte namespaces � necess�rio mudar o valor de false para true na linha em vermelho no c�digo acima. Observe que o conceito e a utiliza��o de namespaces foge ao escopo deste documento.

Agora que estamos com um Document em m�os, vamos mostrar como navegar atrav�s dos seus elementos, modificar seu conte�do e grav�-lo em disco.

M�todos de manipula��o de elementos

Al�m de todos os m�todos definidos pela interface Node, a interface Document prov� m�todos para cria��o de atributos (Attr), elementos (Element) e textos (Text). Veja um resumo de como fazer isso:

createAttribute(String name) � Cria e retorna um atributo que pode ser inserido em qualquer elemento do tipo Element atrav�s do m�todo setAttributeNode(Attr newAttr).
createElement(String tagName) � Cria e retorna um Element que pode ser inserido em outros Elements atrav�s do m�todo appendChild(Node newChild) da interface Node.
createTextNode(String data) � Cria e retorna elementos do tipo Text que podem ser inseridos atrav�s do mesmo appendChild citado acima em elementos do tipo Element.

A interface Document tamb�m possui um m�todo getDocumentElement para obten��o do elemento raiz do XML. Tendo esse elemento do tipo Element em m�os, vamos mostrar um exemplo de c�digo usando o XML da Listagem 1.

Listagem 3 � C�digo mostrando uso da API.


import java.io.IOException;

import java.io.StringReader;

 

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

 

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

import org.xml.sax.InputSource;

 

import com.sun.org.apache.xml.internal.serialize.OutputFormat;

import com.sun.org.apache.xml.internal.serialize.XMLSerializer;

import com.sun.org.apache.xpath.internal.XPathAPI;

 

public class Exemplo {

 

      public static void main(String[] args) throws Exception {

            DocumentBuilderFactory dbf =

                                DocumentBuilderFactory.newInstance();

            DocumentBuilder docBuilder = dbf.newDocumentBuilder();

            Document doc = docBuilder.parse(new File(�arquivo.xml�));

           

            // mudando o valor de 'title'

            Element htmlTag = doc.getDocumentElement();

            Element headTag =

                       (Element) htmlTag.getElementsByTagName("head").item(0);

            Element titleTag =

                       (Element) headTag.getElementsByTagName("title").item(0);

            titleTag.setTextContent("Novo t�tulo");

           

            // adicionando mais par�grafos em 'body'

            Element p1Tag = doc.createElement("p");

            p1Tag.setAttribute("class", "black");

            p1Tag.setTextContent("Um novo par�grafo... ;)");

           

            Element p2Tag = doc.createElement("p");

            p2Tag.setAttribute("class", "white");

            p2Tag.setTextContent("Outro par�grafo..");

           

            Element p3Tag = doc.createElement("p");

            p3Tag.setAttribute("class", "black");

            p3Tag.setTextContent("Fim !");

           

            Element bodyTag =

                        (Element) htmlTag.getElementsByTagName("body").item(0);

            bodyTag.appendChild(p1Tag);

            bodyTag.appendChild(p2Tag);

            bodyTag.appendChild(p3Tag);

           

            // removendo atributo 'onload'

            bodyTag.removeAttribute("onload");

           

            // removendo o primeiro par�grafo de 'body'

            NodeList pTags = bodyTag.getElementsByTagName("p");

            Node p1 = pTags.item(0);

            bodyTag.removeChild(p1);

           

            // fazendo uma consulta XPath

            NodeList resultado = XPathAPI.selectNodeList(bodyTag,

                                                         "p[@class = 'black']");

            for (int i = 0; i < resultado.getLength(); i++) {

                  System.out.println("?: " +

                                     resultado.item(i).getTextContent());

            }

      }

}

Ap�s a execu��o do exemplo acima, gostar�amos de visualizar como ficou o documento XML final. Podemos fazer isso �serializando� o documento usando um OutputStream (System.out ou at� mesmo um FileOutputStream). Veja o exemplo abaixo:

Listagem 4 � Serializa��o de arquivos XML.


XMLSerializer serializer = new XMLSerializer(System.out, new

   OutputFormat(doc, "iso-8859-1", true));

serializer.serialize(doc);

Consultas a elementos Vamos finalizar este artigo ensinando como usar a org.apache.xpath.XPathAPI para fazer consultas XPath (http://www.w3.org/TR/xpath). Ressalto que n�o irei focar em como criar a consulta em si, mas sim em como usar a API em sua execu��o. Para melhor entender sobre XPath.

Alguns dos m�todos est�ticos dispon�veis na XPathAPI s�o:

eval(Node contextNode, String str) Realiza tanto consultas como avalia fun��es XPath e retornam um objeto org.apache.xpath.objects.XObject que pode encapsular strings, n�meros, listas, entre outros a depender do que for passado no par�metro str. O contextNode � o n� que informa o ponto inicial da execu��o de uma busca.
selectNodeList(Node contextNode, String str) Realiza consultas XPath e retorna uma lista de elementos XML (Nodes). O contextNode � o n� que informa o ponto inicial da execu��o de uma busca.
selectSingleNode(Node contextNode, String str) Executa a mesma opera��o do m�todo acima, por�m retorna apenas o primeiro Node encontrado.