Entendendo o Cache de Segundo Nível no Hibernate � Parte 1

Demais posts desta s�rie:
O Cache de Segundo N�vel no Hibernate � Parte 1
O Cache de Segundo N�vel no Hibernate � Parte 3

Porque este artigo � �til
Este artigo apresenta em detalhes como funciona o Cache de 2� N�vel no Hibernate. Embora seja uma API simples de se configurar e verificar imediatamente melhorias de desempenho em cen�rios triviais, sua ativa��o pode trazer alguns imprevistos no comportamento de uma aplica��o, criando situa��es em que h� degrada��o de performance ou inconsist�ncias em processos transacionais se a configura��o ou a forma de uso do Cache n�o estiver correta. Sendo assim, ao longo do artigo apresentaremos alguns aspectos te�ricos que devem ser conhecidos para fazer o bom uso da API de Cache de 2� N�vel, explorando algumas de suas op��es de configura��o e como as mesmas devem ser refletidas ao se parametrizar o EhCache como mecanismo de armazenamento.

Eventualmente toda aplica��o encontra os famosos �gargalos�, ou seja, alguma funcionalidade que n�o prov� tempos de resposta adequados para seus usu�rios, o que causa descontentamentos e frustra��es aos mesmos e muitas vezes os leva � desist�ncia da utiliza��o da funcionalidade ou do produto como um todo.

Em muitas dessas situa��es, o �culpado� � o Banco de Dados, que, como qualquer programa, possui uma quantidade limitada de recursos para atender centenas de solicita��es de forma concorrente. Dentre esses recursos os maiores limitadores em geral s�o os discos r�gidos mec�nicos, que s�o por natureza aparatos seriais: a �agulha� que l� o disco s� pode acessar um setor por vez. Mesmo quando amparado por tecnologias de ponta, como solu��es de storage e discos de estado s�lido, um Banco de Dados precisa superar outra barreira de I/O para atender seus clientes: a rede.

Em um processo de longa dura��o, quando um subconjunto dos dados utilizados � frequentemente requisitado, muitas vezes a execu��o pode ser otimizada mantendo estes dados temporariamente em um n�vel mais pr�ximo da aplica��o, como uma forma de diminuir a lat�ncia no acesso aos mesmos. Esta t�cnica � conhecida como cache e � frequentemente utilizada em dezenas de pontos de uma aplica��o, de forma simples (e.g. um HashMap) ou sofisticada (e.g. um cache distribu�do), visando ora obter melhores resultados de desempenho, ora manter a consist�ncia de um programa.

As pr�prias APIs do Java se beneficiam do uso de caches. Por exemplo, reutilizar uma refer�ncia de uma express�o regular criada via Pattern.compile(�..�) � muito mais eficiente do que solicitar frequentemente a sua cria��o; ClassLoaders devem manter em mem�ria o hist�rico de classes j� carregadas; especializa��es da classe Number (e.g. Long) mant�m um cache de suas inst�ncias para minimizar o efeito de boxing de seus tipos primitivos correspondentes.

Ao trabalhar com um projeto �real�, a decis�o de incluir um Cache pode n�o ser trivial, dependendo dos frameworks e fronteiras transacionais envolvidas nos processos de neg�cio. Neste artigo, veremos como podemos configurar um cache de entidades e consultas de banco de dados em um �mashup� de frameworks frequentemente utilizados: Hibernate, Spring e EhCache.

Cache

A ideia essencial de um cache � guardar resultados que s�o custosos para se calcular ou obter, de tal forma que futuras solicita��es pelos resultados possam ser obtidas mais rapidamente.

Em Java, quando se fala em cache, imediatamente somos remetidos a estruturas de dados do tipo Map, que associam chaves (par�metros) a valores (resultados). Entretanto os Maps (que s�o distribu�dos no JDK), embora estejam presentes no n�cleo das implementa��es de um cache, n�o se preocupam com algumas caracter�sticas essenciais que s�o necess�rias e inerentes a solu��es profissionais de cache, que discutiremos a seguir.

Limita��o do n�mero de elementos

Mem�ria e discos s�o limitados. Se um cache crescer indefinidamente, seus benef�cios reverter-se-�o em preju�zos. Em especial, quando se trata de linguagens gerenciadas como o Java, o uso excessivo de mem�ria pode causar pausas muito longas no garbage collector a ponto de inutilizar uma aplica��o.

Pol�ticas de expurgo

Pol�ticas de expurgo definem crit�rios para remo��o de objetos de um cache assim que o mesmo atinge o n�mero m�ximo de objetos a serem mantidos, ou seja, quais itens s�o �antigos� para serem removidos de modo a liberar espa�o para �novos� itens. Dentre as pol�ticas mais comuns, podemos citar:

� LRU (Least Recently Used): expira-se elementos que tenham sido acessados pela �ltima vez h�mais tempo;

� LFU (Least Frequently Used): expiram-se elementos com o menor n�mero de acessos;

� FIFO (First In First Out): expiram-se elementos mais antigos, ou seja, os que entraram no cache primeiro, como uma fila.

Algumas solu��es de caching, como o JBoss Infinispan, oferecem pol�ticas de expurgo mais sofisticadas como a LIRS (Low Inter-reference Recency Set), que � uma varia��o do LRU. A pol�tica a ser escolhida depende de como o cache ser� utilizado.

No geral, FIFO n�o � uma boa escolha para o cache de Entidades, pois o uso t�pico neste caso � manter em cache as que s�o mais frequentemente acessadas. Entretanto, FIFO pode ser uma escolha adequada em algoritmos cujo acesso aos elementos � praticamente aleat�rio e, na m�dia, com a mesma frequ�ncia.

Quando utilizar e o que colocar em Cache?

Essas perguntas infelizmente n�o t�m uma resposta simples. � necess�rio conhecer os processos de uma aplica��o, suas frequ�ncias de utiliza��o e identificar quais estruturas de dados s�o necess�rias para execut�-los. S� assim somos capazes de avaliar se � poss�vel ou vale a pena utilizar uma solu��o de cache.

Como 'regra' geral, um ponto de partida � a chamada regra de Pareto, a qual se aplica em uma situa��o espec�fica, por�m comum, e ideal para utiliza��o de caches: �Se 20% do conte�do de uma aplica��o � respons�vel por 80% das requisi��es de um sistema, ao minimizar a lat�ncia desses 20% estaremos minimizando 80% da lat�ncia do sistema�. Claro que esses n�meros podem variar e eventualmente 5% podem representar centenas de gigabytes de dados, o que pode dificultar e influenciar bastante a decis�o sobre o que se colocar em cache.

EhCache

O EhCache foi um dos primeiros projetos dedicados � constru��o de caches para Java. Sua primeira vers�o data do ano 2003 e em 2009 o projeto foi adquirido pela empresa Terracotta. Hoje o projeto do EhCache � distribu�do de forma open source e tamb�m comercial, contando com alguns m�dulos extras, em sua maioria tamb�m open source.

Desde sua concep��o at� sua aquisi��o pela Terracotta, o EhCache evoluiu de uma �simples� solu��o de cache em mem�ria para uma solu��o capaz de atender outras demandas n�o-funcionais al�m de performance, tais como capacidade (op��o de salvar registros em disco) e escalabilidade (integra��o com produtos Terracotta). Atualmente o EhCache chama a aten��o por oferecer capacidades de consultas NoSQL r�pidas (integra��o com o projeto Lucene) e pela op��o de armazenamento de centenas de gigabytes de objetos em mem�ria fora do Heap da JVM (BigMemory).

Como o foco deste artigo � na integra��o do EhCache com o Cache de 2� N�vel do Hibernate, vamos explorar apenas os aspectos mais simples de suas configura��es, nos limitando apenas a caches em mem�ria.

Caches no Hibernate

O Hibernate trabalha com dois tipos de cache, rotulados Cache de 1� N�vel (C1N) e Cache de 2� N�vel (C2N). Ao contr�rio do C1N que sempre � utilizado, o C2N precisa ser explicitamente habilitado na configura��o da SessionFactory. Nas se��es seguintes vamos detalhar primeiramente como funciona o C2N e posteriormente como configur�-lo.

Cache de 1� N�vel

O conceito de Cache de 1� N�vel (C1N) � um dos primeiros que desenvolvedores s�o obrigados a compreender quando come�am a trabalhar com o Hibernate.

Essencialmente o C1N � um mapa em mem�ria que mant�m quais entidades j� foram carregadas por uma Session, a qual � frequentemente referenciada como sendo o pr�prio C1N. N�o h� muito segredo com rela��o ao C1N, exceto que se deve lembrar que o mesmo � uma estrutura em mem�ria, isto �, sempre que poss�vel devemos evitar sess�es muito longas e que carregam objetos demais, de forma a colocar press�o no Garbage Collector e degradar o desempenho geral da JVM.

Cache de 2� N�vel

O Cache de 2� N�vel (C2N) atua de maneira completamente diferente do C1N, n�o � habilitado por padr�o e requer configura��o adicional para funcionar. Por�m, t�o importante quanto saber configurar � compreender como funciona �por baixo dos panos� a API de C2N no Hibernate, de modo que possamos tirar o melhor proveito da tecnologia, seja modificando o c�digo para trabalhar em favor do C2N, seja evitando situa��es em que o uso do C2N possa piorar o desempenho da aplica��o.

Visibilidade global e ciclo de vida estendido

...

Quer ler esse conteúdo completo? Tenha acesso completo