Artigo Java Magazine 15 - Entity Beans no JBoss

Esse artigo faz parte da revista Java Magazine edi��o 15.

lass="subtitulo5" style="margin-right: 70.75pt;">Entity Beans no JBoss
Parte 2: Tuning da persist�ncia

Obtendo o m�ximo de performance na intera��o entre o container e o banco de dados

Na primeira parte desta s�rie apresentamos o mecanismo de persist�ncia CMP/CMR do EJB. Vimos como ele nos permite enxergar os dados sob uma �tica orientada a objetos, deixando para o container EJB a tarefa de gerar os comandos SQL para recupera��o e atualiza��o desses dados em bancos relacionais. Mostramos tamb�m como o mapeamento entre objetos e tabelas pode ser customizado no JBoss.

Nesta segunda parte, veremos os recursos de tuning disponibilizados pelo JBoss, que permitem otimizar o container para diferentes necessidades de uma aplica��o. E veremos como a programa��o de EJBs pode ser facilitada pelo uso de outra ferramenta livre, o XDoclet.

O objetivo das otimiza��es mostradas � minimizar o tr�fego de rede entre o JBoss e o banco de dados. Para minimizar o tr�fego de rede, deve-se diminuir a quantidade de comandos SQL enviados ao banco de dados, e reduzir a quantidade de dados retornada por cada comando. Em uma aplica��o "tradicional", seria necess�rio modificar a l�gica e os comandos SQL � algo demorado e arriscado (pela possibilidade de introduzir bugs no c�digo). Em uma aplica��o J2EE, podemos atuar apenas sobre a configura��o do servidor e nos descritores de deployment da aplica��o, sem modificar uma �nica linha de c�digo Java, resultando em maior produtividade e menor risco.

Os princ�pios e estrat�gias utilizados podem ser aplicados para outros servidores de aplica��es, mas os detalhes espec�ficos de configura��o e tuning mostrados aqui s�o espec�ficos para o JBoss. Outros servidores possuir�o seus pr�prios par�metros e descritores espec�ficos.

Nota
Nos exemplos, foi usada a configura��o padr�o do JBoss, com o HSQLDB embutido. No entanto, os mesmos procedimentos se aplicariam a qualquer outro servidor de banco de dados, estando ele na mesma m�quina ou numa esta��o independente. Bastaria utilizar os recursos do banco em quest�o para que ele exiba um log dos comandos SQL recebidos do servidor de aplica��es.

Estudo de caso

Nosso estudo de caso para o tuning da persist�ncia � a aplica��o desenvolvida na primeira parte desta s�rie. Trata-se de uma simples agenda de contatos que utiliza duas entidades: Contato e Categoria. O exemplo inclui tamb�m uma aplica��o web, escrita segundo o modelo MVC, que permite fazer consultas e altera��es sobre os dados da agenda. A Figura 1 ilustra as principais p�ginas dessa aplica��o, para situar o leitor no nosso processo de tuning. A aplica��o completa pode ser obtida do site da Java Magazine.

O que acontece quando o usu�rio requisita a primeira p�gina, a listagem de categorias? Tudo inicia pelo link fornecido pela p�gina inicial da aplica��o, que provoca a execu��o do servlet controlador de contatos. O servlet requisita a rela��o de todas as categorias ao session bean de fachada, e o session bean invoca o m�todo findAll() do entity bean Categoria. O retorno do m�todo � uma cole��o de refer�ncias locais a inst�ncias deste entity bean, e o session bean pede a cada refer�ncia o seu VO. Todos os VOs retornados s�o inseridos em uma nova cole��o, que � devolvida ao servlet. O servlet ent�o insere esta cole��o como um atributo da requisi��o HTTP, que � encaminhada para a p�gina JSP. Por fim, a p�gina JSP formata a cole��o em uma tabela HTML. A Figura 2 ilustra todo o processo.

Esta � a vis�o para o desenvolvedor das aplica��es, mas o �Administrador do Servidor de Aplica��es Java" (veja o quadro "Administra��o J2EE") necessita de uma vis�o mais detalhada, que inclua a intera��o entre o servidor de aplica��es e o banco de dados. � f�cil imaginar que o m�todo findAll() provoca a execu��o de uma consulta SQL, mas ser� que esta consulta retorna todos os atributos da entidade? Ou ser� que os atributos s�o recuperados posteriormente, sob demanda (na execu��o dos m�todos getXXX() correspondentes)?

Um mecanismo objeto-relacional qualquer ir� atuar de forma semelhante a um DataControl do Windows ou outras ferramentas de acesso transparente ao banco: ser� executada uma vers�o da consulta que retorna apenas as chaves prim�rias dos registros desejados. Este conjunto de chaves � mantido em mem�ria (ou em um arquivo tempor�rio), e posteriormente os campos individuais de cada registro s�o recuperados, um a um, conforme a demanda. Isto gera o problema �N+1�, onde uma consulta qualquer gera N+1 acessos ao banco de dados, sendo �N� a quantidade de registros retornados. Entity beans BMP n�o t�m como escapar desse problema mas, com entidades CMP, o container tem a capacidade de otimizar o acesso, utilizando recursos de carga antecipada e caches.

O primeiro passo � descobrir se a configura��o padr�o do servidor gera ou n�o o problema �N+1�. Para isso, siga as instru��es do quadro "Exibindo comandos do HSQLDB", depois reinicie o JBoss, preferencialmente depois de j� ter feito o deployment da aplica��o de exemplo e inseridos alguns contatos e categorias.

Nota
Este estudo de caso foi realizado em uma instala��o nova da vers�o 3.2.3 do JBoss. Outras vers�es podem utilizar configura��es padr�o distintas, gerando resultados um pouco diferentes dos apresentados; ou mesmo podem implementar algoritmos diferenciados de otimiza��o de acesso ao banco e assim gerar seq��ncias diferentes de comandos SQL. Entretanto, a mec�nica geral ser� essencialmente igual e, desde que seja utilizada uma vers�o da s�rie 3.2.x, os mesmos par�metros de tuning estar�o dispon�veis.

Ao executar a p�gina de listagem de categorias, vemos no log do JBoss as seguintes entradas, geradas pelo HSQLDB (as entradas foram reduzidas e quebradas, para maior legibilidade):

[STDOUT] 0:SELECT t0_c.id FROM CATEGORIA t0_c

[STDOUT] 0:SELECT id, nome, descricao FROM CATEGORIA

WHERE (id=1) OR (id=2) OR (id=3)

[STDOUT] 0:COMMIT

Bem, o resultado foi um pouco melhor do que o �N+1�. Foram executadas duas consultas, uma retornando as chaves prim�rias de todas as categorias, e outra trazendo todos os atributos das tr�s primeiras (e �nicas) categorias existentes. O par�metro page-size, que veremos mais adiante, determina quantos registros ser�o recuperados em cada acesso ao banco. Observe que as categorias foram recuperadas baseando-se nos valores expl�citos de suas chaves prim�rias. Isso significa que, em uma tabela contendo uma maior quantidade de dados, apenas os primeiros registros teriam sido recuperados.

Encontramos a explica��o para este comportamento examinando o arquivo <JBOSS>/server/default/conf/standardjbosscmp-jdbc.xml (aqui "<JBOSS>" indica o diret�rio de instala��o do servidor). Este XML define os padr�es, caso o pacote ejb-jar n�o inclua seu pr�prio descritor jbosscmp-jdbc.xml, ou para os par�metros n�o fornecidos pelo descritor incluso na aplica��o. No in�cio desse arquivo, temos:

<datasource>java:/DefaultDS</datasource>

<datasource-mapping>Hypersonic SQL</datasource-mapping>

<create-table>true</create-table>

<remove-table>false</remove-table>

<read-only>false</read-only>

<read-time-out>300000</read-time-out>

<row-locking>false</row-locking>

<pk-constraint>true</pk-constraint>

<fk-constraint>false</fk-constraint>

<preferred-relation-mapping>foreign-key</preferred-relation-mapping>

<read-ahead>

<strategy>on-load</strategy>

<page-size>1000</page-size>

<eager-load-group>*</eager-load-group>

</read-ahead>

<list-cache-max>1000</list-cache-max>

...

Este trecho, al�m de definir como padr�o o uso do banco de dados HSQLDB embutido, estabelece uma estrat�gia on-load de leitura antecipada (read-ahead), com tamanho de p�gina 1000. Isto significa que os resultados da execu��o de um m�todo finder ser�o carregados em blocos de no m�ximo mil entidades, e mantidas no preload cache do JBoss (apresentado adiante).

Antes de explorar as otimiza��es poss�veis, vamos analisar um pouco mais o comportamento da aplica��o. Clique em uma categoria para exibir o formul�rio de edi��o. O log do JBoss ir� mostrar os seguintes comandos SQL:

[STDOUT] 0:SELECT id

FROM CATEGORIA WHERE id=2

[STDOUT] 0:SELECT id, nome, descricao

FROM CATEGORIA WHERE id=2 ...

Quer ler esse conteúdo completo? Tenha acesso completo