Clusters Web com Tomcat: Distribui��o de Carga e Alta Disponibilidade

Esse artigo faz parte da revista�Java Magazine ediç�o 29. Clique aqui para ler todos os artigos desta ediç�o

Clique aqui para ler esse artigo em PDF.

Java Livre

Clusters Web com Tomcat

Distribuiç�o de Carga e Alta Disponibilidade

Aprenda a configurar v�rios servidores Tomcat como um cluster, de modo a atender mais usu�rios e ocultar deles panes em algum dos servidores

Fernando Lozano

Cluster � um dos termos mais usados em toda a inform�tica, identificando qualquer configuraç�o com v�rios computadores com o objetivo de fornecer maior capacidade bruta de trabalho, e algum n�vel de toler�ncia � falhas. Neste artigo estamos interessados em um tipo bem espec�fico de cluster � voltado a aplicaç�es web J2EE.

Os exemplos ser�o apresentados utilizando o Tomcat 5 (5.5.x ou 5.0.x), mas todos os conceitos ser�o v�lidos para outros containers web, livres e propriet�rios. N�o far� diferença usar o J2SE 1.4.2 ou 5.0, desde que seja utilizada a vers�o do Tomcat correspondente ao seu Java (5.0.x com o J2SE 1.4.x; 5.5 com o J2SE 5.0).

E o melhor: suas aplicaç�es web, se desenvolvidas conforme as recomendaç�es do J2EE e algumas boas pr�ticas, n�o v�o precisar sofrer qualquer modificaç�o para se adequarem �s configuraç�es de cluster apresentadas. No entanto, muitas aplicaç�es ainda s�o desenvolvidas sem seguir essas recomendaç�es, podendo n�o funcionar corretamente num cluster (tamb�m podendo apresentar problemas em outras situaç�es).

Para mais informaç�es sobre a forma �correta� de desenvolver aplicaç�es web J2EE, consulte o quadro �Desenvolvendo para clusters�. Para conhecer alguns conceitos de clusters e a terminologia relacionada usada nesse artigo consulte o quadro �Conceitos de clusters web etc.�.

Este artigo assume que que o leitor j� tem algum conhecimento pr�vio da instalaç�o e configuraç�o do Tomcat e do Apache, al�m de conhecimento de desenvolvimento de aplicaç�es web. A instalaç�o do Tomcat e Apache foi abordada antes nesta mesma coluna, na ediç�o n� 6, e no artigo de Gabriel Esteves na ediç�o n� 8. Fundamentos do desenvolvimento de aplicaç�es web com o Tomcat, incluindo o uso de suas aplicaç�es administrativas, foram apresentados nesta coluna nas ediç�es n� 18, 19 e 20.

Preparaç�o

A configuraç�o ser� feita em duas etapas. Primeiro ser� criado um cluster que fornece apenas maior escalabilidade, dividindo a carga de trabalho entre v�rios servidores Tomcat. Depois ser� demonstrado como fornecer tamb�m toler�ncia a falhas, permitindo que um n� assuma de forma transparente os usu�rios que eram atendidos por outro n� que falhou.

Para que seja poss�vel testar o ambiente de cluster, simulando v�rios usu�rios, o leitor ir� necessitar de pelo menos dois navegadores web instalados em seu computador. Por exemplo, o Firefox e o Internet Explorer (IE) no Windows; ou um Firefox e um Konqueror no Linux.

Embora o ambiente de produç�o preferencial para clusters Tomcat sejam servidores Unix e Linux, a configuraç�o � independente do sistema operacional. Particularmente, o leitor tamb�m poder� seguir os exemplos em qualquer vers�o do Windows a partir da 98.

Apenas a instalaç�o do servidor web que atuar� como balanceador ser� diferente em cada plataforma. Para os detalhes, consulte os quadros �Instalaç�o do Apache e mod_jk em Linux�, �Instalaç�o do Apache e mod_jk em Windows� e �Instalaç�o do IIS com mod_jk no Windows�

Clusters Tomcat + Apache

Um cluster web � constitu�do por um balanceador de carga, que o usu�rio �enxerga� como sendo o servidor web que responde ao seu navegador, e um conjunto de servidores web (ou de containers web) que s�o efetivamente os n�s do cluster.

Para balanceador, optamos pelo Servidor Web Apache 2.0. O quadro �Clusters web no J2EE� apresenta mais detalhes sobre a configuraç�o gen�rica desse cluster e os seus requisitos. Neste artigo estamos focando numa implementaç�o espec�fica, aplic�vel em muitas situaç�es t�picas, utilizando os recursos do Tomcat.

A Figura�1 apresenta a arquitetura f�sica do cluster que ser� constru�do. Um �nico servidor Apache, rodando o m�dulo mod_jk, atua como balanceador de carga para duas inst�ncias do Tomcat. Para construir a configuraç�o deste artigo, ser� necess�rio, portanto, instalar um Apache e duas c�pias do Tomcat em diret�rios diferentes. Usu�rios Windows podem usar a vers�o do Apache nativa para seus sistemas.

M�dulos e conectores

O mod_jk � um m�dulo de extens�o para o Apache e outros servidores web, que permite sua integraç�o a um container web Tomcat. Ele � baseado no protocolo AJP (Apache Java Protocol), que permite a um servidor web obter v�rias informaç�es de gerenciamento do container. Apesar do AJP n�o ser parte oficial da plataforma J2EE, ele � um padr�o de mercado, sendo utilizado por v�rios outros containers e extens�es de servidores web.

Embora seja comum dizer que o Tomcat � um container web, esta afirmaç�o n�o � muito precisa. O container web em si, chamado Catalina, � apenas um dos componentes que formam o Tomcat. Outros componentes s�o o compilador de p�ginas JSP, chamado Jasper (sem relaç�o com o JasperReports), os v�rios conectores que gerenciam conex�es de redes, e v�rios projetos do Jakarta Commons, como o DBCP para pools de conex�es JDBC.

No lado do Tomcat, deve ser configurado e ativado o conector Jk, que recebe requisiç�es AJP. Este conector � parte da instalaç�o padr�o do Tomcat desde suas primeiras vers�es. Com o conector Jk ativo, seria poss�vel desligar a funcionalidade de servidor web embutida no Tomcat, fornecida pelo conector Coyote, por�m � recomend�vel manter este conector para que seja poss�vel acessar aplicaç�es administrativas (Manager e Admin) em cada n� Tomcat de forma independente. O conector Coyote tamb�m nos permite validar o funcionamento individual de cada n� do cluster, e assim isolar problemas de configuraç�o do balanceador.

Portas TCP e pacotes multicast

Ser� utilizado um �nico computador para montar o cluster, de modo que todos os leitores possam experimentar as configuraç�es indicadas e validar suas aplicaç�es. Por isso, temos que atribuir portas TCP diferentes para cada instalaç�o do Tomcat. Ser� utilizado o endereço de loopback do TCP/IP (127.0.0.1). Assim o computador do leitor n�o necessitar� estar ligado a uma rede.

Cada n� do cluster anuncia sua presença aos demais utilizando pacotes multicast. Um pacote multicast � endereçado a um subconjunto dos computadores presentes em rede local. Ele � diferente de pacotes unicast, endereçados a um �nico computador e de pacotes broadcast, endereçados a todos os computadores na rede. O uso do multicast facilita muito a manutenç�o do cluster, pois torna desnecess�rio se ter em cada n� uma lista dos endereços e portas dos demais n�s. Al�m disso, com o uso de pacotes multicast, � consumida menos largura de banda do que se forem utilizados pacotes unicast ou broadcast.

O uso do multicast pode exigir configuraç�es especiais do seu sistema operacional ou dos seus equipamentos de rede (switches e roteadores). Para leitores que venham a testar a configuraç�o em Linux, recomendamos a consulta ao quadro �IP Multicast no Linux�.

Replicaç�o de sess�es

A replicaç�o de sess�es HTTP � a �alma� do cluster, pois � ela que permite que um n� do cluster assuma os usu�rios que estavam sendo atendidos por outro n� que falhou. Ela � realizada por conex�es TCP diretas entre cada par de n�s. Vers�es do Tomcat anteriores � 5.0 n�o traziam o suporte a esse recurso, que tinha de ser fornecido por um software externo como um servidor de aplicaç�es JBoss usando o Tomcat como container. V�rias soluç�es eram baseadas em bancos de dados relacionais ou mesmo arquivos compartilhados em rede para realizar a replicaç�o das sess�es.

Diferentemente da maioria dos produtos de terceiros[1], a replicaç�o nativa do Tomcat � baseada em mem�ria, n�o em armazenamento em disco ou em banco de dados. Al�m de ser mais leve e r�pida, isso elimina um potencial ponto de falha no ambiente � afinal se o banco de dados utilizado para a replicaç�o cair, morre o cluster. Mas nada impediria o uso dessas soluç�es com o Tomcat.

� poss�vel acrescentar ou remover n�s ao cluster a qualquer momento. Ao entrar no cluster, um novo n� detecta os demais pelos multicasts e requisita uma c�pia inicial do estado de todas as sess�es HTTP, antes de passar a aceitar requisiç�es. J� se um n� cair (ou for desligado do cluster). Os demais n�s tamb�m ir�o perceber que um deles n�o est� mais enviando os multicasts (ou ent�o que ele n�o responde na conex�o de replicaç�o) e ir�o parar de replicar com este n�. O balanceador tamb�m ir� perceber que o n� falho n�o mais responde, e parar de encaminhar requisiç�es a ele.

Para o balanceador, o acr�scimo de um novo n� � igual � inicializaç�o do cluster. Afinal, os v�rios n�s n�o s�o inicializados exatamente ao mesmo tempo, ent�o obrigatoriamente o cluster passa seus primeiros segundos de vida com apenas um n�, depois entra o segundo n�, e assim por diante.

Entretanto, a configuraç�o do balanceador em geral tem que relacionar todos os n�s que poderiam possivelmente fazem parte do cluster, ent�o acrescentar um n� realmente novo exigiria atualizar a configuraç�o do balanceador. Neste sentido, o Apache � uma boa opç�o, pois sua reinicializaç�o � bem r�pida, e em sistemas Linux ele pode ser reconfigurado sem reinicializaç�o. Durante esta reinicializaç�o ou reconfiguraç�o h� uma possibilidade remota de se perder algumas requisiç�es de usu�rios, mas pode ser ignorada, pois n�o � maior do que a chance de se perder uma requisiç�o devido ao congestionamento na pr�pria rede.

Clusters para balanceamento de carga

" [...] continue lendo...

Clusters Web com Tomcat: Distribui��o de Carga e Alta Disponibilidade

Aprenda a configurar vários servidores Tomcat como um cluster, de modo a atender mais usuários e ocultar deles panes em algum dos servidores.

Artigos relacionados