Artigo Java Magazine 26 - Persist�ncia Turbinada II

Esse artigo faz parte da revista Java Magazine ediç�o 26. Clique aqui para ler todos os artigos desta ediç�o

Clique aqui para ler essa revista em PDF.

Persist�ncia Turbinada II

O lado Negro da força JDBC

Explorando as t�cnicas de mais baixo n�vel da JDBC � para desenvolvedores dispostos a ganhar desempenho a (quase) qualquer preço.

Na ediç�o anterior, apresentamos as t�cnicas de programaç�o JDBC, estendendo o padr�o de projeto DAO de forma a obter os mesmos benef�cios de desempenho de ferramentas O/R � mas mantendo as vantagens de um estilo de programaç�o de �baixo n�vel�, acessando o bando de dados diretamente.

Este artigo d� seq��ncia a nossa s�rie sobre JDBC e persist�ncia em geral, com uma variedade de t�cnicas e dicas mais curtas que n�o renderiam sozinhas um artigo inteiro. Um ponto em comum dessas dicas � que vamos explorar �truques sujos� como extens�es de JDBC e de SQL, que muitas vezes s�o inevit�veis em nome do desempenho m�ximo.

Uma observaç�o; muitas dicas deste artigo n�o s�o garantidamente independentes de banco de dados. Minha maior experi�ncia � com o Oracle, mais, em muitos casos, diversos bancos suportam as mesmas t�cnicas apenas com diferenças nos detalhes (como sintaxes SQL diferentes).

Neste artigo, usamos �banco de dados� (ou �BD� ou �banco�) como termo mais simples para Sistema de Gerenciamento de Banco de Dados (SGBD).

Statements ou PreparedStatments?

� comum a d�vida de que tipo de statement JDBC utilizar: o simples Statement ou sua extens�o, o PreparedStatement. Revisando, o PreparedStatement estende Statement de forma a resolver tr�s problemas.

Simplifica a representaç�o dos par�metros: n�o � necess�rio envolver strings com �� (aspas simples) nem converter datas na sintaxe aceita pelo banco de dados, n�o � preciso converter booleanos para �Y�/�N� ou 1/0, e assim por diante.
Aumenta o desempenho: a execuç�o � mais eficiente porque o driver e/ ou banco de dados processam o texto SQL uma s� vez, fazendo um cache da sua representaç�o compilada. Al�m disso, quando uma consulta � executada, antes de ler os dados do resultado o driver tamb�m precisa receber o banco de dados os metadados sobre o resultset (nome, tipo e outras informaç�es sobre cada coluna do cursor de resultados¹). Com PreparedStatement, esses metadados s� s�o transferidos na primeira execuç�o; depois tamb�m ficam num cache do driver.

Suporta updates em batch2: o PreparedStatement permite executar updates repetitivos, que variam somente pelos par�metros, com os m�todos addBatch() e executeBatch(). (Note que estamos usando o termo �update� em min�sculas para significar qualquer alteraç�o, seja via INSERT, UPDATE ou DELETE, no banco.)

Num capitulo dispon�vel online do livro �Java Programming with Oracle JDBC�,

(oreilly. com/catalog /jorajdbc/chapter/ch 19.html), o autor Donald Bales apresenta um

benchmark comparando ambos os tipos de statements. Ele mostra que Statement � mais

r�pido para um n�mero pequeno de execuç�es de um INSERT (entre ~60 e ~120, variando conforme o driver). Para quantidades maiores de operaç�es, PreparedStatement � at� duas vezes mais r�pido. Bales adverte contra o uso de PreparedStatement para um n�mero pequeno de operaç�es, mas eu discordo, pois os caches do banco de dados e do driver s�o de longo prazo: mesmo que voc� n�o execute um determinado INSERT cem vezes num loop, certamente ir� execut�-lo muito mais vezes ao longo de horas ou dias³.Prefiro usar PreparedStatement por default, sempre que n�o houver evid�ncia de n�o ser a melhor opç�o - inclusive em casos onde a funcionalidade de Statement seja suficiente. Esta recomendaç�o � especialmente

forte para bancos de dados de maior porte, que possuem otimizadores de consultas

mais poderosos. Nestes casos o custo de compilaç�o das consultas � maior, pois envolve a an�lise de estat�sticas das tabelas, geraç�o de planos de execuç�o complexos, paralelizaç�o de consultas etc.

A documentaç�o da JDBC recomenda o uso de Statement para consultas din�micas.

Um exemplo simples de consulta din�mica � uma aplicaç�o �cliente SQL� que

permite ao usu�rio digitar comandos SQL arbitr�rios. Esse caso extremo � OK para

Statement, mas e um caso raro. Para aplicaç�es comuns, o mais usual � ter consultas

parcialmente din�micas: comandos SQL complexos, montados segundo condiç�es que mudam a cada invocaç�o, como no m�todo a seguir:

Venda[] findVendas (long codltem, Data datalni,

Date dataFim, int status) {

StringBuffer sql = new StringBuffer(

�SELECT FROM VENDAS WHERE item=?�);

if(datalni!= null) sql.append(� AND data >= ?�);

if(dataFim!= null) sql.append(� AND data <= ?�);

if (status!= -1) sql.append(� ANDstatus = 1�);

PreparedStatement stmt =

getConn().prepareStatement(sql.toString());

...

}

Com tr�s trechos opcionais, o n�mero de poss�veis consultas distintas de findVendas()

sera 2³ = 8. Isso ainda � muito pouco para nos preocuparmos; mas e se fossem 16

par�metros opcionais, gerando at� 65.536 consultas diferentes? O senso comum (e o

javadoc) nos diria que n�o � boa id�ia usar PreparedStatement - para n�o encher o cache nem pagar os custos maiores de inicializaç�o com consultas raramente repetidas.

Mas na pr�tica, m�todos desse tipo tendem a ter algumas combinaç�es de par�metros

muito mais freq�entes que outras. Al�m disso, os bancos de dados costumam ser

inteligentes para manter no cache as consultas executadas com mais freq��ncia Statement era bem mais �til nos primeiros tempos da JDBC, quando havia drivers que

nem implementavam PreparedStatement.

Por outro lado, se a sua aplicaç�o tiver muitas consultas �extremamente din�micas�,

isso e mau sinal. Pode ser melhor mudar sua implementaç�o de forma a ter

consultas mais fixas. Os maiores problemas de consultas din�micas est�o na depuraç�o

e no tuning. Quando alguma coisa funciona de forma errada ou muito lentamente, a

correç�o ser� mais dif�cil se cada execuç�o gerar um comando SQL diferente. Uma alteraç�o que corrige um caso pode estragar outro, sendo dif�cil testar todas as consultas

resultantes de cada permutaç�o de muitos par�metros opcionais.

Alguns desenvolvedores j� repararam que certas consultas SQL executam com

efici�ncia maior com um Statement. Isso aconteceu comigo, em operaç�es como:

DELETE FROM WHERE data
DELETE FROM VENDAS WHERE data < TO_DATE('01/03/2005')

O DELETE 1 era usado para limpar registros desnecess�rios de uma tabela extremamente grande (com dezenas de milh�es de registros). O problema � que o 1 demorava no m�nimo um minuto para executar, mesmo que " [...] continue lendo...

Artigo Java Magazine 26 - Persist�ncia Turbinada II

Artigo publicado pela Java Magazine edição 26.

Artigos relacionados