Persist�ncia Turbinada, DAOs otimizados, Byte Code, Caching e JDBC Avan�ado

A plataforma Java estreou com os applets, mas come�ou a ser levada a s�rio a partir da introdu��o da JDBC. Come�amos com uma API de baixo n�vel, modelada segundo o padr�o ODBC da Microsoft, que � eficiente, mas requer bastante codifica��o. Com o tempo surgiram solu��es de persist�ncia cada vez mais f�ceis e transparentes, como o Persistent State Service (PSS) da OMG, Java Data Objects (JDO; JSR-12), Hibernate, EJB (BMP e depois CMP), Castor e dezenas de alternativas propriet�rias.

Mas com o tempo tamb�m descobrimos que as solu��es de alto n�vel, orientadas � produtividade e a t�cnicas OO, n�o servem para todos os cen�rios poss�veis. Da mesma forma que j� virou rotina se falar que nem todas as aplica��es Java precisam de EJB ou de servidores J2EE ou de web services, tamb�m acontece em alguns casos de a velha API JDBC ser a melhor solu��o para persist�ncia. Ou mesmo a �nica vi�vel.

Saiba mais: Criando e consumindo APIs

Este artigo explora algumas id�ias de programa��o de bancos de dados em Java, pensando no programador que por algum motivo n�o quer, ou n�o pode, utilizar persist�ncia autom�tica. N�o vamos nos dedicar especificamente � API JDBC � pressupomos alguma familiaridade com conex�es, statements, resultsets e companhia. O plano � explorar t�cnicas que permitem programar diretamente em JDBC, mas com vantagens de estrutura��o, desempenho e produtividade. E se o seu problema � decidir entre o uso de JDBC ou de uma camada de persist�ncia de mais alto n�vel, tamb�m exploramos essa quest�o, apresentando os pontos fortes e fracos de cada alternativa.

De JDBC a DAO

Quando a JDBC foi lan�ada, as primeiras aplica��es feitas com a API tinham uma tend�ncia de ser bastante desestruturadas, com c�digo JDBC espalhado por toda a aplica��o, misturado com a l�gica de neg�cio e de GUI. A situa��o era bem pior do que em ambientes de desenvolvimento cliente/servidor ent�o existentes, como o PowerBuilder ou o VisualBasic, porque Java n�o tinha componentes de GUI �data-aware� ou IDEs especializados em programa��o de bancos de dados. Com o tempo a tecnologia Java evoluiu, mas em dire��es diferentes dos ambientes RAD[1]. Por um lado, surgiram v�rias solu��es de persist�ncia objeto/relacional (O/R), mas em paralelo, houve tamb�m uma evolu��o das pr�ticas de programa��o de BD �hardcore�, com c�digo JDBC escrito � m�o.

A mais importante evolu��o a partir da programa��o JDBC pura foi o padr�o de projeto DAO (Data Access Object). A motiva��o deste padr�o � tornar o c�digo de persist�ncia mais organizado, reus�vel e desacoplado da l�gica de neg�cio. Temos duas entidades principais: os objetos de valor (Value Objects ou VOs) e as classes DAO. Veja um exemplo na Listagem 1.

A pr�tica mais comum � ter uma classe de VO para cada tabela, com cada coluna mapeada para um atributo, e cada linha mapeada para uma inst�ncia do VO. Mas tamb�m podemos ter VOs definidos a partir de classes de um modelo orientado a objetos; esse modelo ser� mapeado para tabelas n�o necessariamente id�nticas, um para um, �s classes (por exemplo, devido � normaliza��o). Ou podemos ter uma mistura de ambos os crit�rios. Em qualquer caso, o VO � um �pacote� de informa��es que ser�o preservadas no banco de dados.

O c�digo que faz a persist�ncia fica na classe DAO, a qual muitas vezes � implementada como uma classe utilit�ria sem nenhum estado � com m�todos static ou seguindo o pattern Singleton. Neste artigo optamos por DAOs �stateful� (com estado) e com inst�ncias diferenciadas, ou seja, n�o-Singleton. Como podemos ver na Listagem 1, isso � �til para associar o DAO a conex�es, de forma a suportar a execu��o de v�rias opera��es persistentes numa mesma transa��o � sem precisar passar a conex�o como par�metro a cada m�todo.

DAOs e persist�ncia objeto/relacional

Os mandamentos da programa��o orientada a objetos nos fariam associar a funcionalidade aos dados, por exemplo escrever ordem.update() ao inv�s de dao.update(ordem). Mas o desacoplamento promovido pelo DAO serve para tornar o VO independente do mecanismo de persist�ncia. Se a implementa��o inicial for feita com JDBC, mas quisermos migrar para JDO na pr�xima vers�o, o encapsulamento do c�digo de persist�ncia nos DAOs permite fazer essa mudan�a com um impacto m�nimo sobre o c�digo dos VOs ou de qualquer outra parte da aplica��o.

Os sistemas de persist�ncia autom�tica para Java mais festejados s�o precisamente aqueles que se distinguem por suportar persist�ncia sobre objetos de valor, tamb�m chamados de POJOs (�Plain Old Java Objects�), em contraste a outros sistemas como o EJB/CMP (at� 2.1) que exigem a implementa��o de uma s�rie de interfaces para tornar um objeto �persist�vel�. Nestes sistemas, como o Hibernate ou o futuro EJB/CMP 3.0, a implementa��o do DAO � generalizada pelo framework. Em vez de termos que escrever m�todos para restore, create etc., o sistema de persist�ncia � capaz de executar estas opera��es para qualquer POJO. Isso � feito, em primeiro lugar, com o uso de reflection, instrumenta��o de bytecode (que o JDO chama de �enhancing�), ou ambos � de maneira que o sistema de persist�ncia possa ler os atributos do POJO para fazer um update no banco de dados ou definir esses atributos ap�s uma leitura.

[nota] Neste artigo usamos �update� em min�sculas para indicar uma modifica��o no banco, com os comandos SQL UPDATE, INSERT ou DELETE, ou via m�todos que os executem. [/nota]

Em segundo lugar, com a gera��o autom�tica de c�digo SQL para as opera��es de leitura, update etc. de cada POJO. Ambas as funcionalidades costumam depender tamb�m de arquivos de metadados ou descritores, que especificam o mapeamento entre tabelas e POJOs.

Os sistemas de persist�ncia autom�tica t�m outras vantagens sobre a programa��o JDBC:

H� muito menos c�digo para escrever (obrigatoriamente, s� os POJOs).
Podemos contar com um cache de mem�ria dos POJOs, que elimina execu��es repetitivas de consultas que retornam os mesmos objetos.
Podemos ter facilidades de locking autom�tico, otimista ou pessimista.
O gerador autom�tico de consultas pode gerar c�digo otimizado para cada SGBD.
Recursos importantes de orienta��o a objetos s�o mapeados para o mundo relacional, por exemplo usando tabelas diferentes para cada camada de heran�a e gerando joins para ler os objetos.

Estas s�o qualidades comuns a todos os sistemas de persist�ncia objeto/relacional, n�o havendo muita diferen�a pelo fato de se usar POJOs ou n�o. Por outro lado, tamb�m existem algumas desvantagens comuns a todos os sistemas O/R:

Qualquer consulta que n�o seja trivial e que n�o seja mape�vel diretamente para um modelo orientado a objetos n�o ser� suportada pelo sistema de persist�ncia.
Mesmo para as opera��es que s�o facilmente mape�veis para um modelo OO, podemos ser obrigados a usar consultas ad hoc por motivo de desempenho.

Por exemplo, uma consulta que retorna o n�mero m�dio de vendas di�rias por dia por item, em todo o ano de 2004, � extremamente eficiente em SQL:


SELECT codItem, TRUNC(data, 'yyyymmdd�), AVG(quantidade) FROM VENDA

  WHERE data >= ? AND data < ?   --- Passar 01/01/2004 e 01/01/2005

  GROUP BY codItem, TRUNC(data, �yyyymmdd�);

A princ�pio, esta consulta poderia ser substitu�da por c�digo puramente OO. Podemos invocar um m�todo do sistema O/R que retorna todo o extent (conjunto total de inst�ncias) de Venda na forma de uma Collection de POJOs. Depois filtramos essa cole��o em mem�ria, eliminando as vendas que n�o sejam para o ano 2004. Finalmente, percorremos os itens restantes, fazendo os agrupamentos e calculando as m�dias. Mas um desenvolvedor experiente saber� que isso ter� um desempenho terr�vel. Os proponentes das ferramentas O/R afirmar�o que n�o, pois existe um cache em mem�ria dos objetos Venda e ap�s algumas consultas estes objetos tendem a estar imediatamente dispon�veis.

Isso realmente funciona muito bem para tabelas pequenas. Mas e se nossa tabela de vendas tiver um milh�o de registros para cada ano? Uma resposta poss�vel � "mem�ria � barata, compre mais" � mas isso n�o produz o desempenho desejado. Digamos que voc� pode ser dar ao luxo de usar um heap de 10 Gb, acomodando todos os registros no cache de POJOs. Se o fizer, ter� outros problemas de desempenho. Para detalhes, veja o quadro �Os problemas de caches gigantes�.

A solu��o seria usar APIs de consulta mais completas? Ao inv�s de somente retornar o extent, o sistema O/R poderia tamb�m suportar op��es de filtros, agrupamento e outras. Mas nesse caso, � necess�rio suportar praticamente todas as facilidades do SQL, o que equivale a consultas ad hoc � mas com uma sintaxe muito inferior. Precisamos criar um objeto de consulta, definir v�rios par�metros para o filtro, ordena��o, agrupamento etc. E o resultado ser� menos leg�vel que uma vers�o SQL. Como conclu�mos no artigo �Programa��o com Regras� (Edi��o 15), linguagens especializadas existem por boas raz�es.

Saiba mais: Neste Guia de Refer�ncia voc� encontrar� todo o conte�do que precisa para aprender sobre a SQL.

De fato, raros sistemas O/R se d�o ao trabalho de suportar mais que um m�nimo de op��es de consultas atrav�s de APIs. O que fazem � oferecer facilidades de consultas ad hoc. Estas facilidades t�m a pretens�o de evitar a polui��o de programas �OO-puro� com c�digo SQL, atrav�s do uso de linguagens de consulta especializadas. Todavia, estas linguagens costumam consistir em 90% de SQL e 10% de extens�es OO. Algumas extens�es como as necess�rias para mapear heran�a para joins s�o extremamente �teis. Por outro lado, acho dif�cil justificar a substitui��o de uma sintaxe SQL funcionalmente satisfat�ria, como �TO_UPPER(x)�, por algo como �x.toLowerCase()� (como � feito no JDO).

� importante observar que essas linguagens de consultas objeto/relacionais s�o altamente incompat�veis entre diferentes padr�es de sistemas O/R (como JDO versus Hibernate), enquanto o padr�o ANSI SQL-92 � bem mais port�vel em compara��o. E em alguns casos a emenda � pior que o soneto: se f�ssemos seguir � risca o paradigma de linguagens OO, uma express�o como �x.toLowerCase()�, quando x=NULL, deveria gerar um erro (como NullPointerException). Mas n�o � o que acontece, pois as linguagens de �consulta O/R� s�o mapeadas para equivalentes em SQL e executam com a sem�ntica do SQL, neste caso temos o mapeamento TO_UPPER(NULL)?NULL.

De qualquer forma, com consultas ad hoc passamos por cima do sistema de persist�ncia, programando quase do mesmo jeito que far�amos numa aplica��o que s� usasse JDBC. Poupamos somente a escrita do �esqueleto� do c�digo de consulta (ex.: criar um Statement, fazer um loop para ler o ResultSet etc.). Isso � especialmente verdadeiro para consultas que n�o retornam POJOs mas sim colunas �brutas�, como no exemplo com o agrupamento sobre a tabela de vendas.

Quando estudamos o assunto de linguagens orientadas a objetos versus bancos de dados relacionais, logo somos informados de um �gap sem�ntico�: nossa linguagem e nosso BD seguem paradigmas diferentes, nem sempre compat�veis. Registros n�o s�o objetos; chaves estrangeiras n�o s�o relacionamentos entre objetos; heran�a n�o existe no modelo relacional; normaliza��o n�o faz parte de linguagens OO; e por a� vai.

Depois que aprendemos isso, somos apresentados a solu��es O/R (que v�o de ferramentas de persist�ncia autom�tica at� bancos OO-puros), visando eliminar o gap sem�ntico atrav�s do mapeamento autom�tico de conceitos diferentes entre os dois paradigmas. Por exemplo, relacionamentos s�o mapeados para chaves estrangeiras e tabelas associativas; heran�a pode ser mapeada para v�rias tabelas atrav�s de joins. Qual � o furo dessa promessa das ferramentas O/R? � simples: funciona bem, mas s� para consultas simples. T�o logo sua aplica��o precise fazer consultas complexas � com agrupamentos, joins entre v�rias tabelas, outer joins, consultas aninhadas, invoca��es a stored procedures, uso de fun��es SQL avan�adas (como as de OLAP), fun��es propriet�rias (como parti��es ou tabelas aninhadas) � o gap sem�ntico torna-se intrat�vel, e as ferramentas O/R jogam a toalha.

Isso tudo pode parecer pessimista, mas n�o significa que voc� deva abandonar as solu��es O/R. Elas podem ser excelentes para implementar boa parte de uma aplica��o, especialmente as opera��es CRUD (Create, Restore, Update, Delete) para o ciclo de vida b�sico dos dados. Mas s�o raras as aplica��es n�o-triviais que s� fazem manipula��es de dados nessa categoria. E s�o abundantes os cen�rios em que precisamos de consultas ad hoc: na gera��o de relat�rios; em opera��es ETL (Extract-Transform-Load), em data mining e OLAP. E mesmo no escopo de CRUD, as consultas ad hoc s�o necess�rias em cen�rios mais pesados. Por exemplo, ao expurgar todas as vendas do ano anterior da tabela principal para uma tabela de hist�rico ou consolidada, voc� n�o vai querer carregar na mem�ria um milh�o de objetos de uma tabela, somente para regrav�-los em outra.

DAOs envenenados

J� que n�o podemos nos livrar totalmente de consultas ad hoc e, por conseq��ncia, de APIs de baixo n�vel, vale a pena continuar investindo no conhecimento de programa��o JDBC.

Como o desempenho � uma preocupa��o constante, o problema mais s�rio a atacar � a falta de cache nas consultas feitas com JDBC. Isso � especialmente s�rio para os chamados �registros populares� (ou "objetos populares"), os que s�o utilizados com muita freq��ncia relativamente ao seu n�mero ou � sua distribui��o.

Por exemplo, numa tabela EMPRESA no topo da hierarquia de neg�cio da aplica��o (empresa possui departamentos, que possuem funcion�rios etc.), com apenas um registro, este registro solit�rio ser� extremamente popular, mesmo que n�o seja utilizado com muita freq��ncia. J� numa tabela FUNCIONARIO com 10 mil registros, para uma aplica��o de ERP que consulta esta tabela intensamente, todos os registros s�o populares. Fazer cache de registros nessas categorias (que poder�amos chamar �populares por n�mero�) � bastante simples, sendo uma pr�tica freq�ente em aplica��es que usam programa��o JDBC.

Parece relativamente simples implementar um cache manual como mostrado na Listagem 2, mas isso oculta algumas dificuldades e decis�es importantes:

Consist�ncia: Estamos supondo que, uma vez carregada uma Empresa para a mem�ria, � aceit�vel retornar sempre o mesmo objeto do cache, sem nos preocuparmos com a consist�ncia entre o cache e o banco de dados. Se as opera��es UPDATE, INSERT e DELETE desses objetos tamb�m s�o feitas somente atrav�s de EmpresaDao, isso parece seguro, pois os outros m�todos de DAO podem manter o cache consistente, por exemplo removendo um objeto do cache ap�s fazer um DELETE. Obviamente n�o podemos ter a possibilidade de aplica��es externas ou consultas SQL ad hoc modificarem a tabela EMPRESA.
Resultados nulos: No m�todo find(), cuidamos para n�o fazer cache de consultas mal sucedidas. Lembre que num Map, podemos mapear uma chave para um valor nulo. Portanto, poder�amos ter adotado a estrat�gia de fazer o cache.put() mesmo quando a consulta n�o encontra nenhum objeto, e consultar o cache da seguinte forma:

if (cache.contains(key)) return (Empresa) cache.get(key);

Isso seria mais eficiente, pois a partir do momento em que for feita uma consulta como find("XYZ"), sendo que n�o existe nenhuma empresa com nome="XYZ", o cache ficar� com um mapeamento "XYZ"?null, e futuras invoca��es a find("XYZ") retornar�o imediatamente a partir do cache, sem necessidade de fazer a consulta. Mas esse cache de consultas "nulas" oculta um perigo. Pode ocorrer um n�mero arbitr�rio de consultas com chaves inexistentes � basta pensar em usu�rios humanos cometendo erros de digita��o num formul�rio. Isso faria o uso de mem�ria do cache crescer sem limite, especialmente se a aplica��o ficar um longo per�odo no ar, sem reinicializa��o. Por isso, em geral � melhor n�o fazer cache de consultas que n�o retornam dados, ainda que isso diminua um pouco a efici�ncia do cache. Mas esta � uma decis�o caso a caso.

Transa��es: Se a inst�ncia de EmpresaDao for compartilhada por transa��es concorrentes, precisamos de sincroniza��o para garantir que as opera��es sobre o cache sejam consistentes com o banco de dados. N�o podemos permitir que diversas transa��es, em threads separados, executem opera��es como update() e restore() simultaneamente confiando somente no controle de concorr�ncia do banco de dados, o qual n�o ir� proteger o acesso �s estruturas de dados do cache, nem garantir a atomicidade da opera��o completa (acesso ao cache + acesso ao BD). Uma estrat�gia de caching descuidada pode criar bugs de consist�ncia entre o cache e banco de dados; pode chegar at� a corromper o BD, causando a perda do resultado de transa��es inteiras.

Outro problema s�rio � como lidar com erros. Se uma opera��o UPDATE, INSERT ou DELETE falhar, n�o devemos refletir esta opera��o no cache. Isso pode parecer simples, pois se houver algum erro na opera��o no banco de dados (ex.: uma viola��o de constraint), uma SQLException ser� lan�ada ao executar o statement, antes de termos modificado o cache. O problema � que a invoca��o a esses m�todos pode ser apenas uma das muitas opera��es de atualiza��o feitas por uma transa��o � e um erro em qualquer update dever� cancelar os efeitos de todos os updates anteriores da mesma transa��o, inclusive os que tiveram sucesso. Somente ap�s o commit() temos a garantia que uma atualiza��o ser� dur�vel, e s� ent�o poder�amos atualizar o cache de forma segura. Como resolver isso?

Uma possibilidade � utilizar auto-commit � ou fazer o commit() nos m�todos do DAO � para opera��es de atualiza��o. Isso � aceit�vel em transa��es que executem uma �nica atualiza��o, mas n�o � escal�vel para aplica��es menos triviais. Outra solu��o popular � limitar o uso de cache a objetos n�o atualiz�veis, como objetos de configura��o que s�o cadastrados estaticamente (na popula��o inicial da base de dados), ou objetos cadastrados de forma especial, por exemplo via importa��o de sistemas externos; sendo que nessas ocasi�es podemos ter um �gancho� para limpar o cache.

Uma terceira solu��o (muito mais divertida) � programar um cache mais sofisticado.

Caches de gente grande

A implementa��o de cache da Listagem 2 tem pouca utilidade, pois oferece um ganho de desempenho desprez�vel exceto para os raros casos em que � amplamente aplic�vel (como objetos imut�veis), e parece criar muitas dores de cabe�a para valer a pena. Mas isso n�o nos deve fazer desistir da id�ia de utilizar caches de mem�ria para programas que usam JDBC. Afinal, sistemas O/R fazem isso de forma confi�vel e resultando num desempenho excelente. � preciso somente aprender alguns novos truques. Ali�s, mesmo que voc� prefira usar persist�ncia autom�tica, � bom saber como essas tecnologias funcionam para utiliz�-las de forma mais eficaz.

Na Listagem 3, temos duas camadas de cache. O cache global, que fica numa vari�vel static, � compartilhado por toda a aplica��o e tem um ciclo de vida de longo prazo. Na implementa��o apresentada, uma vez que um POJO entre nesse cache global, ele nunca ser� eliminado.

O cache local � espec�fico para cada transa��o. Pressupomos um mapeamento um para um entre transa��es e threads; ou seja, se a aplica��o possuir v�rias transa��es simult�neas, elas estar�o executando em threads distintos. Isso nos permite utilizar facilidades da classe ThreadLocal, que funciona como um Map onde a chave (impl�cita) � o thread corrente, e o valor � qualquer objeto desejado � no caso um HashMap que � a estrutura de cache local.

A estrat�gia de uso do cache de duas camadas n�o � complexa, mas tem algumas sutilezas. Detalhamos a seguir a l�gica de cada opera��o com este cache:

A opera��o find() procura primeiro no cache local. Se o objeto for encontrado, ele � retornado.

Se n�o encontramos o objeto no cache local, tentamos novamente, s� que no cache global. Se o objeto for encontrado ele � retornado, mas tamb�m � adicionado ao cache local. Isso agiliza pesquisas futuras, pois consultas ao cache global s�o menos eficientes (por exigirem sincroniza��o). E o cache local tamb�m tem outros pap�is importantes, como logo veremos.
Se o objeto n�o for encontrado em nenhum cache, ele � lido do banco de dados e registrado em ambos os caches, local e global.

As opera��es insert() e update() registram o novo estado do objeto, mas s� no cache local.
A opera��o remove() tamb�m reflete esta a��o no cache local, por�m de uma forma diferente: substituindo o mapeamento {nome�Objeto} por {nome�null}.
Temos um novo m�todo close() que deve ser invocado quando fechamos uma transa��o. O argumento commit=true indica que a transa��o foi confirmada com sucesso: ou seja, as altera��es de registros foram tornadas dur�veis no SGBD, e devemos fazer o mesmo no cache. Mesmo se n�o tiver havido commit, � essencial invocar este m�todo (veja os coment�rios a seguir). Note tamb�m que os mapeamentos {nome�null}, produzidos pelos remove(), eliminar�o POJOs do cache global.

Essa estrutura de cache de duas camadas emula o comportamento das transa��es do SGBD. Num banco transacional, as atualiza��es feitas por uma transa��o s� s�o vis�veis por outras transa��es ap�s o commit. O cache local funciona da mesma forma: � medida que criamos, alteramos ou removemos objetos, estas opera��es (al�m de executadas sobre a base de dados) s�o registradas apenas no cache local da transa��o. Somente ap�s o commit tornamos estas altera��es vis�veis para outras transa��es, refletindo-as no cache global.

O cache global � importante porque evita consultas sucessivas aos mesmos objetos, entre transa��es sucessivas. Esse cache funciona como um espelho do banco de dados na mem�ria, devendo ser totalmente consistente com o estado do BD, e devendo tamb�m suportar o isolamento entre transa��es. Uma conseq��ncia disso � que, na etapa 1.1 do algoritmo anterior, quando um objeto � encontrado no cache global, este objeto deve ser clonado. Se o clone n�o fosse feito, as altera��es feitas ao objeto por uma transa��o ficariam vis�veis para outras transa��es que tivessem obtido o mesmo objeto do cache global.

Outro papel importante do sistema de cache (especialmente o de cache local) � manter a integridade referencial dos POJOs. Isso significa que, para uma determinada transa��o, duas consultas a EmpresaDao.find(nome) devem retornar o mesmo objeto, para o mesmo valor nome.

EmpresaDao dao = new EmpresaDao(conn); Empresa e1 = dao.find("Sun Microsystems"); Empresa e2 = dao.find("Sun Microsystems"); // Testa integridade referencial e2.setCotacao(10.6); System.out.println(e1.getCotacao()); // deve imprimir �10.6� // Testa integridade de updates no BD e1.setEndereco("Santa Clara, CA"); dao.update(e1); // Deve gravar cotacao=13.2 e endereco=Santa Clara, CA dao.update(e2); // Redundante com o update anterior!

Neste exemplo, as duas consultas find() devem retornar o mesmo objeto. Se retornassem objetos distintos (e1 != e2), ainda que a princ�pio iguais (e1.equals(e2)), ter�amos bugs de consist�ncia. Altera��es feitas em e1 n�o seriam vistas por e2 e vice-versa, pois do ponto de vista do heap de objetos do Java seriam objetos totalmente independentes. Tamb�m poderia haver inconsist�ncia entre as opera��es de atualiza��o do DAO. No exemplo, se as refer�ncias e1 e e2 n�o apontassem para o mesmo objeto em mem�ria, e2.update() seria cancelado o efeito de e1.update(); e o registro no BD ficaria com o valor antigo para o endere�o e o valor novo somente para a cota��o.

Caches parciais

J� discutimos a necessidade de cache para objetos populares por n�mero. Mas um caso mais complicado � a popularidade por distribui��o. Imagine uma tabela ORDEM_SERVICO que tem 10 milh�es de registros. Nem todos esses registros s�o "populares", pois 99% deles s�o ordens j� fechadas, que permanecem na tabela apenas para finalidade de hist�rico � e s� s�o usados eventualmente por algum relat�rio mensal ou anual. Mas todos os registros com status "ABERTO" s�o populares, pois s�o constantemente consultados e modificados durante o ciclo de vida de uma ordem de servi�o, at� o seu fechamento. Os registros que foram fechados muito recentemente tamb�m s�o populares, pois tendem a ser consultados por gerentes de opera��es, por funcion�rios que trabalham sobre a ordem de servi�o, ou por relat�rios online.

Temos a� dois crit�rios que determinam a �popularidade por distribui��o�: o valor de um atributo (status=ABERTO) e a data de cria��o do objeto. � muito dif�cil criar um cache que seja inteligente o bastante para manter na mem�ria apenas os registros que interessam � os populares. Uma alternativa � usar refer�ncias fracas (com APIs como WeakReference e WeakHashMap). Podemos adicionar objetos ao cache � vontade, pois se faltar mem�ria o coletor de lixo da JVM ir� invalidar as refer�ncias fracas, apagando os objetos que sejam ating�veis somente por tais refer�ncias. Isso n�o privilegia os objetos populares, mas simplesmente esvazia o cache quando houver pouca mem�ria livre.

Existem algoritmos que promovem refer�ncias fracas a refer�ncias fortes para os objetos mais acessados (os populares); mas isso come�a a complicar as coisas, sem falar que o uso intenso de refer�ncias fracas aumenta muito a carga sobre o garbage collector. Por isso, muitas vezes a melhor solu��o � somente limitar o tamanho da estrutura de dados de cache, e ter uma pol�tica de eviction (veja o quadro �Os problemas de caches gigantes�).

Esta vers�o do cache poderia se beneficiar de mais algumas melhorias. Por exemplo, poder�amos criar uma classe que encapsula a Connection e tamb�m fabrica os DAOs. Isso nos permitiria invocar um �nico m�todo commit(), que faria o commit na conex�o e tamb�m invocaria os close() sobre todos os DAOs que foram instanciados para esta conex�o.

Caches autom�ticos

Neste ponto, voc� deve estar se perguntando se a t�cnica de programa��o manual de DAOs com caches n�o � muito trabalhosa. Como se n�o bastasse programar o BD diretamente com JDBC e SQL, ainda temos que tornar nossos DAOs duas vezes mais complexos com todas essas estruturas de dados e algoritmos de cache � lembrando que caches devem melhorar o desempenho e preservar a consist�ncia, sen�o, melhor n�o t�-los! Mas se tivermos que escrever todo esse c�digo adicional para cada uma das dezenas de classes DAO de uma aplica��o de m�dio ou grande porte, parece esfor�o demais.

A n�o ser, � claro, que possamos fazer isso de uma s� vez, reusando uma implementa��o gen�rica em todos os nossos DAOs.

Recapitulando o artigo �A Din�mica do Java� (Edi��o 14), uma proxy din�mica � uma facilidade do J2SE (presente desde a vers�o 1.3), consistindo na cria��o autom�tica pela JVM de uma classe que implementa uma lista de interfaces especificada. Proxies din�micas s�o usadas para interceptar invoca��es a outras classes que implementem a mesma interface; s�o uma implementa��o do padr�o de projeto Proxy. O artigo da Edi��o 14 demonstrou as proxies din�micas com um exemplo simples de logging, mas podemos ver na Listagem 4 uma aplica��o bem mais poderosa dessa facilidade.

Saiba mais: Eliminando vazamentos de mem�ria em Java

A classe CacheHandler implementa os recursos de cache de opera��es de DAO que vimos anteriormente, mas com uma vantagem: funciona para qualquer DAO. Para isso ser poss�vel s� precisamos criar uma interface para cada DAO e instanciar os DAOs atrav�s de m�todos de f�brica (o que � uma boa op��o de design, de qualquer maneira). Uma vez tendo esta arquitetura, os m�todos de f�brica podem gerar DAOs que s�o encapsulados por uma proxy din�mica, com um CacheHandler associado.

Qualquer invoca��o ao DAO ser� interceptada por CacheHandler.invoke(). Antes de delegar a invoca��o ao m�todo de destino no DAO, o handler pode executar qualquer c�digo. No caso, temos c�digo de cache. Observe que este c�digo � mais complexo que as vers�es das Listagens 3 e 4, por ser mais generalizado. Suportamos m�todos com um n�mero arbitr�rio de argumentos e utilizamos todos estes argumentos como chaves de cache. Assim, podemos ter consultas com v�rios crit�rios de filtro, por exemplo Empresa.find(String localidade, boolean ativa). Uma invoca��o como find("Curitiba", true) ir� consultar e atualizar uma posi��o de cache �nica. O objeto Method tamb�m � utilizado como chave, havendo um HashMap separado para cada m�todo, de forma que n�o haver� conflitos se um mesmo DAO possuir diversos m�todos com listas de par�metros iguais.

Observe que a Listagem 4 n�o implementa um cache de duas camadas, nem outros requisitos de uma vers�o de produ��o, como a gera��o de estat�sticas (ex.: taxa de acerto do cache), logs, ou suporte espec�fico a m�todos que n�o retornam nenhum valor e n�o precisam de cache (como m�todos de update do DAO). Estas melhorias seriam desej�veis numa vers�o de produ��o deste c�digo.

Mesmo nesse ponto, voc� pode estar se perguntando se tal investimento em arquitetura vale a pena. N�o estar�amos gradualmente implementando nosso pr�prio �JDO de garagem�? Isso � verdade em parte � estamos usando algumas t�cnicas comuns em ferramentas O/R. Por outro lado, continuamos trabalhando no n�vel de banco de dados relacional e n�o necessariamente no n�vel de objetos. Uma das grandes defici�ncias das ferramentas O/R � que suas otimiza��es mais avan�adas beneficiam exclusivamente os c�digos mais puros, que s� acessam dados do BD atrav�s dos objetos Java que os mapeiam. Por exemplo, o cache de mem�ria � organizado em termos de POJOs. J� o nosso CacheHandler n�o tem nenhum preconceito que favore�a esses objetos comuns. Ele ir� funcionar da mesma maneira para uma consulta n�o-OO, como mostrado na Listagem 5.

Saiba mais: Introdu��o � Programa��o Orientada a Objetos em Java

Nessa listagem temos uma consulta que n�o envolve POJOs em nenhum momento � nem nos par�metros nem nos dados retornados. Isso n�o faz diferen�a para o CacheHandler, para o qual os tipos dos par�metros (chaves do cache) e dos retornos (valores do cache) s�o irrelevantes. Se voc� fizer duas invoca��es consecutivas com ano=2004, a primeira far� uma consulta, mas a segunda retornar� instantaneamente do cache. Essa facilidade de cache para consultas ad hoc n�o � comum em ferramentas O/R (logo veremos porque).

No projeto para o qual desenvolvi esta t�cnica, temos tarefas tipicamente OLAP onde uma tabela gigantesca (a tabela de "fatos�) deve ter todos seus registros cruzados com uma s�rie de tabelas muito menores (as tabelas de �dimens�es�). Pense, por exemplo, numa tabela LANCAMENTO_CONTA com milh�es de registros, e uma tabela TAXA com apenas 70 registros. Come�amos com uma consulta que retorna os lan�amentos de um dia, e vamos iterando o ResultSet e processando os lan�amentos. Mas sobre cada lan�amento, pode incidir uma taxa diferente. O problema � que n�o podemos simplesmente ler o lan�amento e a taxa de uma s� vez com um join, pois n�o h� um c�digo de taxa no registro de lan�amento: a taxa deve ser escolhida segundo um conjunto de regras de neg�cio complexas, o que nos obriga fazer isso com c�digo Java ap�s ter lido o lan�amento, e depois ler a taxa com uma nova consulta � uma consulta adicional para cada lan�amento. Para piorar, haver� milhares de lan�amentos utilizando a mesma taxa, o que torna essas consultas extremamente redundantes.

A solu��o mais popular para esses casos � ler toda a tabela TAXA para um array em mem�ria no in�cio do processamento (ou da aplica��o, se esta tabela for imut�vel). Ent�o, para cada registro da tabela de fatos, executamos nossas regras de neg�cio e uma vez identificado o tipo de taxa, obtemos seu valor dessa tabela em mem�ria. Isso funciona, mas � trabalhoso. Tem que ser repetido para cada nova situa��o semelhante, al�m de deixar o c�digo mais complicado e facilitar uma s�rie de bugs.

Uma solu��o muito melhor seria utilizar um DAO para ler as taxas, e uma classe como nosso CacheHandler para evitar consultas repetidas para as mesmas taxas. Com essa mudan�a, no caso real a que me referi, um determinado lote de trabalho que, sem nenhum cache, demorava 20 minutos para processar, passou a demorar 30 segundos, devido � elimina��o de milhares de consultas id�nticas.

� importante observar que essa t�cnica de cache de consultas ad hoc deve ser usada com muita discrimina��o e cuidado. Ao contr�rio dos DAOs com cache restrito a POJOs, n�o existe uma maneira simples e reus�vel de garantir a consist�ncia entre o cache e os dados no BD. Na Listagem 5, se voc� invocar calculaMediasAnuais(2004), depois fizer updates em alguns registros de VENDAS (com datas de 2004) e depois invocar novamente calculaMediasAnuais(2004), o resultado ser� o mesmo de antes, sem considerar os dados alterados.

Existem maneiras de resolver esse problema. Poder�amos limitar o cache a consultas sobre dados hist�ricos, que nunca mais ter�o atualiza��es, mas essa � uma solu��o limitada. Outra id�ia seria fazer os m�todos de update de OrdemCompraDao limparem o cache das consultas ad hoc, for�ando uma nova execu��o ap�s qualquer update. Isso funciona bem se a consulta l� uma �nica tabela e esta tabela tem updates pouco freq�entes; mas se eles s�o muito freq�entes, eliminamos totalmente a vantagem de desempenho do cache. E se a consulta realizar joins entre v�rias tabelas (que � um dos principais motivos para usarmos consultas ad hoc), a solu��o se torna quase invi�vel, pois os DAOs de m�ltiplas classes precisariam sincronizar o cache uns dos outros, o que exigiria listeners para notifica��o entre DAOs. Voc� percebe onde isso vai parar: numa complexidade de arrancar os cabelos.

A moral da hist�ria � que a programa��o direta em JDBC/SQL (sem sistemas O/R) � preferencial quando precisamos de um alto grau de controle, ou de usar truques avan�ados para obter maior desempenho. Tamb�m vemos porque ferramentas O/R n�o suportam cache de consultas arbitr�rias (n�o limitadas a consultas simples que retornam POJOs, como por exemplo extents e relacionamentos) � embora possuam toda a infra-estrutura necess�ria. � porque isso � arriscado, e os autores destes sistemas n�o querem ser inundados por reclama��es de programadores que n�o tomaram algum cuidado e tiveram um bug de consist�ncia de cache ou banco de dados. Caches mais poderosos s�o uma t�cnica avan�ada a ser utilizada com bastante disciplina e precau��o.

Conclus�es

Neste artigo, procuramos dar nova vida � programa��o JDBC �na unha�, que pode ser bem menos produtiva que o uso de ferramentas O/R � mas que ainda � extremamente necess�ria nos cen�rios onde as op��es de mais alto n�vel n�o se mostram satisfat�rias.

S� porque voc� precisa executar algumas consultas ou atualiza��es com JDBC puro, n�o quer dizer que n�o possa ter um c�digo organizado, reus�vel e eficiente. O padr�o de projeto DAO � a estrutura fundamental para tornar c�digo JDBC mais administr�vel, mas tamb�m nos fornece uma arquitetura que pode ser estendida para atingir os objetivos de reuso e de alto desempenho. Quando todos os m�todos que trabalham com JDBC s�o encapsulados em DAOs, podemos implementar v�rias melhorias interessantes trabalhando sobre esses DAOs.

Para fazer isso, o recurso de proxies din�micas da plataforma Java � extremamente �til, pois permite �injetar� funcionalidades t�o avan�adas quanto caching sem alterar uma �nica linha de c�digo dos DAOs. A mesma t�cnica poderia ser utilizada para outras finalidades. Por exemplo, para tratamento de erros: poder�amos fazer os DAOs lan�aram uma SQLException ao inv�s de trat�-la, e o handler da proxy din�mica faria este tratamento, por exemplo logando o erro e retornando um valor nulo ou default, ou lan�ando uma exce��o da aplica��o.

N�o se sinta obsoleto por programar diretamente em JDBC. Use a melhor API ou ferramenta para cada caso. As op��es de mais baixo n�vel s�o trabalhosas, mas s�o tamb�m mais poderosas, e suas desvantagens podem ser compensadas pelo uso de t�cnicas apropriadas.

Os problemas de caches gigantes

Toda vez que a JVM precisa liberar algum espa�o no heap, o garbage collector precisa percorrer todo o heap, descobrir quais objetos ainda s�o �teis e quais s�o �lixo�, apagar estes �ltimos e reorganizar os que sobraram. O tempo desta opera��o numa implementa��o simples de um garbage collector seria proporcional ao n�mero de objetos.

Mas as JVMs modernas utilizam algoritmos de garbage collection (GC) sofisticados que quase sempre evitam coletar o heap inteiro (o chamado �full-GC�), entre outros truques, que reduzem muito as pausas e o tempo de CPU usado para GC (veja o artigo �Garbage Collection� na Edi��o 5). Mas esses algoritmos n�o fazem milagres; em especial, n�o eliminam totalmente as opera��es full-GC. Os �nicos que aparentemente fazem isso, como os coletores incrementais ou concorrentes, na verdade distribuem os custos de full-GC no tempo.

Ou seja, ao inv�s de travar a aplica��o durante tr�s segundos s� para fazer a coleta de lixo uma vez por minuto, um coletor incremental ou concorrente ir� gastar os mesmos tr�s segundos por minuto, mas sem nenhum travamento aparente; isso porque a coleta � feita em paralelo ou dividida em muitas fatias pequenas. Mas nada disso muda o fato que a JVM estar� torrando 5% do seu tempo de CPU com GC! E se o overhead era de 5% para um heap de 1 Gb, poder� ser de 50% para 10 Gb. Na pr�tica o crescimento � menos que linear com o tamanho do heap, de forma que nossa aplica��o hipot�tica poderia ter um custo de GC de apenas 15% com 10 Gb. Mesmo assim, vale a regra (naturalmente) que quanto maior o heap, maior o tempo gasto com GC.

Isso n�o significa que a plataforma Java n�o seja capaz de gerenciar heaps gigantescos. Significa apenas que com heaps enormes pode ser preciso abrir m�o de parte dos benef�cios do garbage collection e fazer algum grau de gerenciamento manual de mem�ria. O uso de DirectBuffers (introduzidos no J2SE 1.4, veja java.nio.ByteBuffer) permite fazer isso. � uma t�cnica complexa, mas s� quem precisa se aborrecer com isso � o fornecedor do sistema de persist�ncia. Todavia, ainda n�o existe nenhum produto no mercado, de meu conhecimento, que fa�a o gerenciamento manual; talvez porque todo mundo concorde, por outros motivos, que raramente � uma boa id�ia manter a base de dados inteira na mem�ria. E h� mais raz�es:

A complexidade adicional pelo uso de DirectBuffers tornaria os caches menos eficientes que implementa��es convencionais (que �confiam� no GC), para os objetos que n�o existem em volumes imensos e dispensam esta solu��o.
Mesmo um cache gigante pode n�o comportar toda a base de dados. Talvez voc� tenha 10 Gb de cache, mas 200 Gb de dados no BD. A primeira conseq��ncia � que voc� continua correndo o risco de mau desempenho para consultas �pesadas� como nosso exemplo de agrupamento de vendas, pois nunca ser� garantido que todos os dados estar�o no cache. A segunda conseq��ncia � que o cache precisar� de uma estrat�gia de eviction (�desalojamento� ou �expuls�o�). Por exemplo, se s� cabem 10 milh�es de POJOs no cache, quando este n�mero for atingido e mais cinco objetos forem lidos, � preciso remover outros cinco objetos do cache � preferencialmente os cinco que n�o s�o usados h� mais tempo, segundo o m�todo de acesso LRU (Last Recently Used). As estrat�gias de eviction t�m um custo, que � pequeno, mas proporcional ao tamanho do cache.
Talvez a base de dados toda caiba na mem�ria RAM f�sica, mas certamente n�o caber� nas mem�rias cache (L1/L2/L3) do processador, cujo tamanho � no m�ximo de uns poucos megabytes, mesmo em sistemas high-end. Aplica��es com heaps gigantescos, nos quais os dados mais utilizados estejam muito misturados com um volume bem maior de dados raramente utilizados (o que � chamado �baixa localidade�), t�m uma p�ssima efici�ncia de uso das mem�rias cache da CPU.

Listagem 1. DAO e VO.


import java.util.Date;

import java.sql.*;

 

public class Venda {

  private final long ID;

  private String codItem;

  private int quantidade;

  private Date data;

  public Venda (...) {...}

  public String getCodItem () { return codItem; }

  public void setCodItem (String codItem) { this.codItem = codItem; }

  //... mais getters e setters ...

}

 

public class VendaDao {

  private final Connection conn;

  public VendaDao (Connection conn) { this.conn = conn; }

  public Venda restore (long ID) {

    PreparedStatement stmt = null;

    try {

      stmt = conn.prepareStatement(

        "SELECT * FROM VENDA WHERE id=?");

      stmt.setLong(1, ID);

      ResultSet rs = stmt.executeQuery();

      if (rs.next()) return new Venda(

        rs.getLong("id"), rs.getString("codItem"),

        rs.getInt("quantidade"), rs.getDate("data"));

    }

    catch (SQLException e) {}

    finally {

      if (stmt != null)

        try { stmt.close(); } catch (SQLException e) {...}

    }

    return null; // exce��o ou Venda n�o encontrada

  }

  public void create (Venda oc) {...}

  public void remove (Venda oc) {...}

  public void update (Venda oc) {...}

}

 

// Exemplos de uso 

Connection conn = null; // ... obt�m uma conex�o

VendaDao dao = new VendaDao(conn);

Venda venda = dao.restore(99);

venda.setQuantidade(venda.getQuantidade() +1);

dao.update(venda);

conn.commit();

Listagem 2. DAO com Cache simples.


public class Empresa {

  private String nome, descricao;

  // Omitidos: construtor, getters, setters

}

 

import java.sql.*;

import java.util.*;

 

public class EmpresaDao {

  private final HashMap empresas = new HashMap();

  private final Connection conn;

  public EmpresaDao (Connection conn) { this.conn = conn; }

 

  public synchronized Empresa find (String nome) {

    Empresa emp = (Empresa)empresas.get(nome);

    if (emp != null) return emp;

    emp = ... // omitido: JDBC para SELECT

    empresas.put(nome, emp);

    return emp;

  }

 

  public synchronized void create (Empresa emp) {

    // omitido: JDBC para INSERT

    empresas.put(emp.getNome(), emp);

  }

 

  public synchronized void remove (Empresa emp) {

    // omitido: JDBC para DELETE

    empresas.remove(emp.getNome());

  }

 

  public synchronized void update (Empresa emp) {

    // omitido: JDBC para UPDATE

    empresas.put(emp.getNome(), emp);

  }

}

Listagem 3. DAO com Cache mais sofisticado.


import java.sql.*;

import java.util.*;

 

public class EmpresaDao {

  private final HashMap globalCache = new HashMap();

  private final ThreadLocal tlCache = new ThreadLocal(){

    protected synchronized Object initialValue () {

      return new HashMap();

    }

  };

  private final Connection conn;

 

  public EmpresaDao (Connection conn) {

    tlCache.set(null);

    this.conn = conn;

  }

 

  public Empresa find (String nome) {

    // Tenta inicialmente localizar o objeto no cache local.

    HashMap localCache = (HashMap)tlCache.get();

    Empresa emp = (Empresa)localCache.get(nome);

 

    if (emp != null) return emp;

    // Tenta localizar no cache global.

    synchronized (globalCache) {

      emp = (Empresa)globalCache.get(nome);

    }

    if (emp == null) {

      // N�o localizado nem no cache global; l� do BD.

      emp = ... // omitido: JDBC para SELECT

      if (emp != null) synchronized (globalCache) {

        globalCache.put(nome, emp);

      }

    }

    else emp = (Empresa)emp.clone();

    // Adiciona ao cache local, e retorna o resultado.

    if (emp != null) localCache.put(nome, emp);

    return emp;

  }

 

  public void create (Empresa emp) {

    HashMap cache = (HashMap)tlCache.get();

    if (cache.containsKey(emp.getNome()))

      throw new IllegalStateException("Objeto ja criado");

    // omitido: JDBC para INSERT

    cache.put(emp.getNome(), emp);

  }

 

  public void remove (Empresa emp) {

    HashMap cache = (HashMap)tlCache.get();

    if (cache.containsKey(emp.getNome()) &&

      cache.get(emp.getNome()) == null)

        throw new IllegalStateException("Objeto ja removido");

    // omitido: JDBC para DELETE

    ((HashMap)tlCache.get()).put(emp.getNome(), null);

  }

 

  public void update (Empresa emp) {

    HashMap cache = (HashMap)tlCache.get();

    if (cache.get(emp.getNome()) == null)

        throw new IllegalStateException("Objeto nao existe, ou ja removido");

    // omitido: JDBC para UPDATE

  }

 

  public void close (boolean commit) {

    HashMap localCache = (HashMap)tlCache.get();

    if (localCache == null) return; // close() redundante

    tlCache.set(null); // permite ao garbage collector limpar lixo;

                       // limpa o cache para transa��es futuras;

                       // e evita custo de close()s redundantes

 

    if (commit) synchronized (globalCache) {

      for (Iterator i = localCache.entrySet().iterator(); i.hasNext(); ) {

        Map.Entry entry = (Map.Entry)i.next();

        Object key = entry.getKey();

        Object value = entry.getValue();

 

        if (value == null)

          globalCache.remove(key);

        else

          globalCache.put(key, value);

      }

    }

  }

}

 

// Exemplo de uso:

Connection conn = null;

EmpresaDao dao = null;

try {

  conn = null;//... omitido: obt�m conex�o

  dao = new EmpresaDao(conn);

  dao.create(new Empresa("JM", "Java Magazine"));

  conn.commit();   // Se o commit funcionar...

  dao.close(true); // ... sincroniza caches

}

finally {

  if (dao != null) dao.close(false); // Garante que o cache seja limpo

  if (conn != null)

  try { conn.close(); } catch (SQLException e) {}

}

Listagem 4. Cache autom�tico para DAOs.


import java.lang.reflect.*;

import java.lang.reflect.Array;

import java.sql.*;

import java.util.*;

import javax.sql.*;

 

// Handler que implementa cache autom�tico para as invoca��es a uma classe DAO

public final class CacheHandler

  implements InvocationHandler {

  private final Object proxiedObject;

  private final Map caches;

  private static final HashMap noCacheMap = new HashMap();

 

  // Cria um handler de cache para um DAO

  public CacheHandler (Object proxiedObject) {

    this.proxiedObject = proxiedObject;

    caches = Collections.synchronizedMap(new HashMap());

  }

 

  // Determina se o cache � desativado para um m�todo. Esta op��o � feita

  // declarando-se a exce��o NoCache entre os throws do m�todo.

  private boolean noCache (Method method) {

    Boolean b = (Boolean)noCacheMap.get(method);

    if (b == null) {

      b = Boolean.FALSE;

      Class[] exceptions = method.getExceptionTypes();

      for (int i = 0; i < exceptions.length; ++i)

        if (exceptions[i] == NoCache.class) {

          b = Boolean.TRUE;

          break;

        }

      noCacheMap.put(method, b);

    }

    return b.booleanValue();

  }

 

  // Handler de invoca��o de m�todos do DAO.

  public Object invoke (Object proxy, Method method, Object[] args) throws Throwable {

    // Suporte a m�todos que n�o devem ter cache algum.

    if (noCache(method)) return method.invoke(proxiedObject, args);

    // Suporte a m�todos que devem ter cache.

    Object methodKey = makeKey(args);

    Map methodCache = (Map)caches.get(method);

    if (methodCache == null) {

      caches.put(method, methodCache = Collections.synchronizedMap(new HashMap()));

      return invokeAndCache(methodCache, methodKey, method, args);

    }

    return methodCache.containsKey(methodKey) ? methodCache.get(methodKey) : invokeAndCache(

      methodCache, methodKey, method, args);

  }

 

  // Invoca um m�todo e armazena seu resultado no cache.

  private Object invokeAndCache (Map cache, Object key, Method method, Object[] args)

    throws IllegalArgumentException, IllegalAccessException, InvocationTargetException {

    Object ret = method.invoke(proxiedObject, args);

    cache.put(key, ret);

    return ret;

  }

 

  private static Object makeKey (Object[] args) {

    if (args.length == 0) return Boolean.TRUE;

   

    if (!(args[0] instanceof Connection || args[0] instanceof Statement ||

        args[0] instanceof ResultSet || args[0] instanceof DataSource))

      return args.length == 1 && (args[0] == null ||

        !args[0].getClass().isArray()) ? args[0] : new Key(args);

   

    switch (args.length) {

    case 1:

      return Boolean.TRUE;

    case 2:

      if (args[1] == null || !args[1].getClass().isArray())

        return args[1];

      // else fall-through

    default:

      Object[] key = new Object[args.length -1];

      System.arraycopy(args, 1, key, 0, key.length);

      return new Key(key);

    }

  }

 

  // Esta classe implementa a chave do cache. � baseada no array de

  // par�metros para o m�todo, mas precisamos fazer uma s�rie de tratamentos

  // especiais para poder usar este array como chave de um Map 

  static class Key {

    private final Object[] args;

    Key (Object[] args) {

      this.args = args;

    }

    // Necess�rio para podermos usar esta classe como chave de Map.

    public boolean equals (Object obj) {

      if (!(obj instanceof Key)) return false;

      Key other = (Key)obj;

      // Duas chaves ser�o iguais se os seus arrays de par�metros forem iguais.

      // N�o precisamos testar os tamanhos dos dois arrays, pois este equals()

      // s� � invocado para chaves do mesmo cache de m�todo, e todas invoca��es a

      // um determinado m�todo t�m o mwsmo mn�mero de par�metros.

      for (int i = 0; i < args.length; ++i) {

        // Vamos comparar cada par�metro com o da outra chave.

        Object a = args[i], b = other.args[i];

        if (a == null && b == null) continue;

        if ((a == null) != (b == null)) return false;

        // Obt�m o tipo de cada par�metro.

        Class ca = a.getClass(), cb = b.getClass();

        if (ca.isArray()) {

          if (cb != ca) return false;

          // Se os par�metos s�o arrays, precisamos de todo esse c�digo para

          // fazer a compara��o de arrays, o que exige uma vers�o diferente

          // de Arrays.equals() para cada possibilidade de tipo-base do array.

          if (a instanceof Object[])

            { if (!Arrays.equals((Object[])a, (Object[])b)) return false; }

          else if (ca == int[].class)

            { if (!Arrays.equals((int[])a, (int[])b)) return false; }

          else if (ca == byte[].class)

            { if (!Arrays.equals((byte[])a, (byte[])b)) return false; }

          else if (ca == short[].class)

            { if (!Arrays.equals((short[])a, (short[])b)) return false; }

          else if (ca == long[].class)

            { if (!Arrays.equals((long[])a, (long[])b)) return false; }

          else if (ca == char[].class)

            { if (!Arrays.equals((char[])a, (char[])b)) return false; }

          else if (ca == double[].class)

            { if (!Arrays.equals((double[])a, (double[])b)) return false; }

          else if (ca == float[].class)

            { if (!Arrays.equals((float[])a, (float[])b)) return false; }

        }

        else return a.equals(b); // Para n�o-array, basta um equals().

      }

      return true;

    }

    // Necess�rio para podermos usar esta classe como chave de Map:

    public int hashCode () {

      int hash = 0;

      for (int i = 0; i < args.length; ++i)

        if (args[i] != null) {

          // Aqui tamb�m damos suporte a par�metros que s�o arrays.

          if (args[i].getClass().isArray())

            hash ^= Array.getLength(args[i]);

          else

            hash ^= args[i].hashCode();

        }

      return hash;

    }

  }

 

  /* Tag para m�todos que n�o querem cache. basta incluir esta exce��o no

   * throws. Isto simula anota��es, mas � compat�vel com qualquer J2SE. */

  public static final class NoCache extends RuntimeException {

    private NoCache () { }

  }

}

 

// Interface do DAO

public interface EmpresaDao {

  Empresa create (String nome) throws SQLException;

}

 

// F�brica abstrata de DAOs da aplica��o

public class FactoryDao {

  public static EmpresaDao createEmpresa () {

    EmpresaDao dao = new EmpresaDaoImpl();

    try {

      return (EmpresaDao)Proxy.newProxyInstance(

          EmpresaDaoImpl.class.getClassLoader(),

          new Class[]{EmpresaDao.class},

          new CacheHandler(dao));

    }

    catch (IllegalArgumentException e) {

      System.err.println("Falha criando proxy! Retornando DAO sem cache.");

      return dao;

    }

  }

}

 

// Implementa��o do DAO

class EmpresaDaoImpl implements EmpresaDao {

  public Empresa create (String nome) {

    ... // implementa��o omitida

  }

}

Listagem 5. DAO com consulta ad hoc.


import java.sql.*;

import java.util.HashMap;

import java.util.Map;

 

public class VendaDao {

  public Map calculaMediasAnuais (Connection conn, int ano)

    throws SQLException {

    PreparedStatement stmt = conn.prepareStatement(

      "SELECT codItem, TRUNC(data, 'yyyymmdd')," +

      " AVG(quantidade) FROM VENDAS" +

      " WHERE data >= ? AND data < ?" +

      " GROUP BY codItem, TRUNC(data, 'yyyymmdd')");

    stmt.setDate(1, new Date(1900+ano,0,1));

    stmt.setDate(2, new Date(1901+ano,0,1));

    ResultSet rs = stmt.executeQuery();

    HashMap ret = new HashMap();

    while (rs.next())

      ret.put(rs.getString(1), new Double(rs.getDouble(2)));

    return ret;

  }

}

Gloss�rio

Algumas empresas implementaram conceitos de ferramentas cliente/servidor para Java, como componentes �data-aware� (por exemplo, o dbSwing do JBuilder). Mas estas op��es, entre outras mais tradicionais (como SQL embutido), acabaram n�o fazendo muito sucesso na comunidade Java.
Esta consulta SQL funciona no Oracle. No MySQL, por exemplo, substitua TRUNC(data, 'yyyymmdd�) por DAYOFYEAR(data).
Os SGBDs costumam ter um cache de tabelas, que elimina muito do custo de I/O f�sico das queries. Mas n�o elimina os custos tamb�m consider�veis de execu��o de SQL, comunica��o entre a aplica��o e o SGBD, e convers�o entre POJOs e dados brutos de resultsets e statements.
No J2SE 5.0, isso ficaria melhor com tipos gen�ricos: HashMap .

Saiu na DevMedia!

React com Redux:
O Redux atende as necessidades de pelo menos um cen�rio comum em aplica��es cliente, facilitando a comunica��o entre componentes sem acopl�-los. Sua import�ncia � tanta atualmente que muitos programadores t�m aconselhado seu uso independente do tamanho da aplica��o, embora ele facilite o seu crescimento.
Autentica��o em Aplica��es Web:
Tornar algumas p�ginas acess�veis apenas a um grupo de usu�rios autenticados � uma tarefa trivial em aplica��es web. Existem diferentes frameworks para isso, mas a maioria deles cobre desde o cadastro at� as credenciais, passando pela autentica��o e controle de acesso.

Saiba mais sobre Java ;)

Cursos de Java:
Torne-se um programador Java completo. Aqui voc� encontra cursos sobre as mais ferramentas e frameworks do universo Java. Aprenda a desenvolver sites e web services com JSF, Jersey, Hibernate e mais.
Programador Java:
Aprender Java n�o � uma tarefa simples, mas seguindo a ordem proposta nesse Guia, voc� evitar� muitas confus�es e perdas de tempo no seu aprendizado. Vem aprender java de verdade, vem!
Confira nesta edi��o de Java Magazine dados turbinados, aumente a performance de acesso a dados em suas aplica��es usando JDBC avan�ado, DAOs otimizados e caching de dados. Veja tamb�m o novo XP explicado, saiba o que est� mudando no extreme programming em uma resenha detalhada.