Clusters Web com Tomcat: Distribuição de Carga e Alta Disponibilidade

Esse artigo faz parte da revista�Java Magazine edi��o 29. Clique aqui para ler todos os artigos desta edi��o

esse aqui">Clique aqui para ler esse artigo em PDF.

Java Livre

Clusters Web com Tomcat

Distribui��o de Carga e Alta Disponibilidade

Aprenda a configurar v�rios servidores Tomcat como um cluster, de modo a atender mais usu�rios e ocultar deles panes em algum dos servidores

Fernando Lozano

Cluster � um dos termos mais usados em toda a inform�tica, identificando qualquer configura��o com v�rios computadores com o objetivo de fornecer maior capacidade bruta de trabalho, e algum n�vel de toler�ncia � falhas. Neste artigo estamos interessados em um tipo bem espec�fico de cluster � voltado a aplica��es web J2EE.

Os exemplos ser�o apresentados utilizando o Tomcat 5 (5.5.x ou 5.0.x), mas todos os conceitos ser�o v�lidos para outros containers web, livres e propriet�rios. N�o far� diferen�a usar o J2SE 1.4.2 ou 5.0, desde que seja utilizada a vers�o do Tomcat correspondente ao seu Java (5.0.x com o J2SE 1.4.x; 5.5 com o J2SE 5.0).

E o melhor: suas aplica��es web, se desenvolvidas conforme as recomenda��es do J2EE e algumas boas pr�ticas, n�o v�o precisar sofrer qualquer modifica��o para se adequarem �s configura��es de cluster apresentadas. No entanto, muitas aplica��es ainda s�o desenvolvidas sem seguir essas recomenda��es, podendo n�o funcionar corretamente num cluster (tamb�m podendo apresentar problemas em outras situa��es).

Para mais informa��es sobre a forma �correta� de desenvolver aplica��es web J2EE, consulte o quadro �Desenvolvendo para clusters�. Para conhecer alguns conceitos de clusters e a terminologia relacionada usada nesse artigo consulte o quadro �Conceitos de clusters web etc.�.

Este artigo assume que que o leitor j� tem algum conhecimento pr�vio da instala��o e configura��o do Tomcat e do Apache, al�m de conhecimento de desenvolvimento de aplica��es web. A instala��o do Tomcat e Apache foi abordada antes nesta mesma coluna, na edi��o n� 6, e no artigo de Gabriel Esteves na edi��o n� 8. Fundamentos do desenvolvimento de aplica��es web com o Tomcat, incluindo o uso de suas aplica��es administrativas, foram apresentados nesta coluna nas edi��es n� 18, 19 e 20.

Prepara��o

A configura��o ser� feita em duas etapas. Primeiro ser� criado um cluster que fornece apenas maior escalabilidade, dividindo a carga de trabalho entre v�rios servidores Tomcat. Depois ser� demonstrado como fornecer tamb�m toler�ncia a falhas, permitindo que um n� assuma de forma transparente os usu�rios que eram atendidos por outro n� que falhou.

Para que seja poss�vel testar o ambiente de cluster, simulando v�rios usu�rios, o leitor ir� necessitar de pelo menos dois navegadores web instalados em seu computador. Por exemplo, o Firefox e o Internet Explorer (IE) no Windows; ou um Firefox e um Konqueror no Linux.

Embora o ambiente de produ��o preferencial para clusters Tomcat sejam servidores Unix e Linux, a configura��o � independente do sistema operacional. Particularmente, o leitor tamb�m poder� seguir os exemplos em qualquer vers�o do Windows a partir da 98.

Apenas a instala��o do servidor web que atuar� como balanceador ser� diferente em cada plataforma. Para os detalhes, consulte os quadros �Instala��o do Apache e mod_jk em Linux�, �Instala��o do Apache e mod_jk em Windows� e �Instala��o do IIS com mod_jk no Windows�

Clusters Tomcat + Apache

Um cluster web � constitu�do por um balanceador de carga, que o usu�rio �enxerga� como sendo o servidor web que responde ao seu navegador, e um conjunto de servidores web (ou de containers web) que s�o efetivamente os n�s do cluster.

Para balanceador, optamos pelo Servidor Web Apache 2.0. O quadro �Clusters web no J2EE� apresenta mais detalhes sobre a configura��o gen�rica desse cluster e os seus requisitos. Neste artigo estamos focando numa implementa��o espec�fica, aplic�vel em muitas situa��es t�picas, utilizando os recursos do Tomcat.

A Figura�1 apresenta a arquitetura f�sica do cluster que ser� constru�do. Um �nico servidor Apache, rodando o m�dulo mod_jk, atua como balanceador de carga para duas inst�ncias do Tomcat. Para construir a configura��o deste artigo, ser� necess�rio, portanto, instalar um Apache e duas c�pias do Tomcat em diret�rios diferentes. Usu�rios Windows podem usar a vers�o do Apache nativa para seus sistemas.

M�dulos e conectores

O mod_jk � um m�dulo de extens�o para o Apache e outros servidores web, que permite sua integra��o a um container web Tomcat. Ele � baseado no protocolo AJP (Apache Java Protocol), que permite a um servidor web obter v�rias informa��es de gerenciamento do container. Apesar do AJP n�o ser parte oficial da plataforma J2EE, ele � um padr�o de mercado, sendo utilizado por v�rios outros containers e extens�es de servidores web.

Embora seja comum dizer que o Tomcat � um container web, esta afirma��o n�o � muito precisa. O container web em si, chamado Catalina, � apenas um dos componentes que formam o Tomcat. Outros componentes s�o o compilador de p�ginas JSP, chamado Jasper (sem rela��o com o JasperReports), os v�rios conectores que gerenciam conex�es de redes, e v�rios projetos do Jakarta Commons, como o DBCP para pools de conex�es JDBC.

No lado do Tomcat, deve ser configurado e ativado o conector Jk, que recebe requisi��es AJP. Este conector � parte da instala��o padr�o do Tomcat desde suas primeiras vers�es. Com o conector Jk ativo, seria poss�vel desligar a funcionalidade de servidor web embutida no Tomcat, fornecida pelo conector Coyote, por�m � recomend�vel manter este conector para que seja poss�vel acessar aplica��es administrativas (Manager e Admin) em cada n� Tomcat de forma independente. O conector Coyote tamb�m nos permite validar o funcionamento individual de cada n� do cluster, e assim isolar problemas de configura��o do balanceador.

Portas TCP e pacotes multicast

Ser� utilizado um �nico computador para montar o cluster, de modo que todos os leitores possam experimentar as configura��es indicadas e validar suas aplica��es. Por isso, temos que atribuir portas TCP diferentes para cada instala��o do Tomcat. Ser� utilizado o endere�o de loopback do TCP/IP (127.0.0.1). Assim o computador do leitor n�o necessitar� estar ligado a uma rede.

Cada n� do cluster anuncia sua presen�a aos demais utilizando pacotes multicast. Um pacote multicast � endere�ado a um subconjunto dos computadores presentes em rede local. Ele � diferente de pacotes unicast, endere�ados a um �nico computador e de pacotes broadcast, endere�ados a todos os computadores na rede. O uso do multicast facilita muito a manuten��o do cluster, pois torna desnecess�rio se ter em cada n� uma lista dos endere�os e portas dos demais n�s. Al�m disso, com o uso de pacotes multicast, � consumida menos largura de banda do que se forem utilizados pacotes unicast ou broadcast.

O uso do multicast pode exigir configura��es especiais do seu sistema operacional ou dos seus equipamentos de rede (switches e roteadores). Para leitores que venham a testar a configura��o em Linux, recomendamos a consulta ao quadro �IP Multicast no Linux�.

Replica��o de sess�es

A replica��o de sess�es HTTP � a �alma� do cluster, pois � ela que permite que um n� do cluster assuma os usu�rios que estavam sendo atendidos por outro n� que falhou. Ela � realizada por conex�es TCP diretas entre cada par de n�s. Vers�es do Tomcat anteriores � 5.0 n�o traziam o suporte a esse recurso, que tinha de ser fornecido por um software externo como um servidor de aplica��es JBoss usando o Tomcat como container. V�rias solu��es eram baseadas em bancos de dados relacionais ou mesmo arquivos compartilhados em rede para realizar a replica��o das sess�es.

Diferentemente da maioria dos produtos de terceiros[1], a replica��o nativa do Tomcat � baseada em mem�ria, n�o em armazenamento em disco ou em banco de dados. Al�m de ser mais leve e r�pida, isso elimina um potencial ponto de falha no ambiente � afinal se o banco de dados utilizado para a replica��o cair, morre o cluster. Mas nada impediria o uso dessas solu��es com o Tomcat.

� poss�vel acrescentar ou remover n�s ao cluster a qualquer momento. Ao entrar no cluster, um novo n� detecta os demais pelos multicasts e requisita uma c�pia inicial do estado de todas as sess�es HTTP, antes de passar a aceitar requisi��es. J� se um n� cair (ou for desligado do cluster). Os demais n�s tamb�m ir�o perceber que um deles n�o est� mais enviando os multicasts (ou ent�o que ele n�o responde na conex�o de replica��o) e ir�o parar de replicar com este n�. O balanceador tamb�m ir� perceber que o n� falho n�o mais responde, e parar de encaminhar requisi��es a ele.

Para o balanceador, o acr�scimo de um novo n� � igual � inicializa��o do cluster. Afinal, os v�rios n�s n�o s�o inicializados exatamente ao mesmo tempo, ent�o obrigatoriamente o cluster passa seus primeiros segundos de vida com apenas um n�, depois entra o segundo n�, e assim por diante.

Entretanto, a configura��o do balanceador em geral tem que relacionar todos os n�s que poderiam possivelmente fazem parte do cluster, ent�o acrescentar um n� realmente novo exigiria atualizar a configura��o do balanceador. Neste sentido, o Apache � uma boa op��o, pois sua reinicializa��o � bem r�pida, e em sistemas Linux ele pode ser reconfigurado sem reinicializa��o. Durante esta reinicializa��o ou reconfigura��o h� uma possibilidade remota de se perder algumas requisi��es de usu�rios, mas pode ser ignorada, pois n�o � maior do que a chance de se perder uma requisi��o devido ao congestionamento na pr�pria rede.

Clusters para balanceamento de carga

A primeira vers�o do nosso cluster n�o ter� recursos de toler�ncia � falhas. Ela penas permite que a carga de trabalho de usu�rios simult�neos seja distribu�da entre v�rios Tomcats. Esta varia��o do cluster j� era poss�vel no Tomcat 4, e era criada da mesma forma como fazemos com a vers�o 5.0/5.5.

Como n�o h� replica��o de sess�es HTTP, � necess�rio usar um artif�cio para que os dados das sess�es do usu�rio n�o sejam �esquecidos�, por exemplo se a p�gina anterior for atendida por outro n� do cluster. Usamos o recurso conhecido como sticky sessions (traduzindo livremente: �sess�es duradouras�), cujo uso � a principal diferen�a entre um �balanceador gen�rico� e um balanceador espec�fico para HTTP.

O recurso de sticky sessions consiste em se anexar ao identificador da sess�o um sufixo que identifica o n� onde a sess�o foi criada. O balanceador usa o sufixo para garantir que todas as requisi��es posteriores do usu�rio sejam encaminhadas ao mesmo n� do cluster. Se isso n�o for feito, a aplica��o ir� �esquecer� informa��es armazenadas anteriormente na sess�o HTTP. Entretanto, uma falha no n� que cont�m a sess�o do usu�rio ir� obrig�-lo a iniciar uma nova sess�o em outro n� do cluster. E se a aplica��o usar controle de acesso, ser� necess�rio tamb�m um novo login.

Configura��o do Apache e mod_jk para balanceamento de carga

A partir desse ponto, consideramos que o leitor j� instalou o Tomcat, o Apache e o mod_jk (ou ent�o o IIS/PWS e o ISAPI Redirector), seguindo os quadros que fornecem instru��es espec�ficas para seu sistema operacional. Em seguida vamos mostrar as instru��es para a configura��o do cluster.

Configura��o do apache e do mod_jk

Uma instala��o padr�o do Apache 2.0 em Linux[2] cont�m a pasta conf.d, onde podem ser criados arquivos de configura��o adicionais, contendo qualquer comando que seria v�lido no arquivo de configura��o principal httpd.conf. A id�ia com isso � facilitar a organiza��o de configura��es espec�ficas de m�dulos do servidor e o teste de configura��es alternativas.

Deve ser criado na pasta conf.d o arquivo jk.conf. A Listagem 1 apresenta seu conte�do (note que alguns caminhos absolutos ter�o que ser transformados em caminhos relativos no Windows). A diretiva jkMount redireciona um padr�o de URL recebido pelo Apache para ser processado pelo mod_jk, e enviado para um dos n�s Tomcat. No caso, foi redirecionado o contexto /testacluster.

O contexto /jk, espec�fico do mod_jk, gera uma p�gina para monitorar o estado dos n�s do cluster, por exemplo para saber quais est�o ativos e a carga de trabalho em cada um. Estas requisi��es n�o ser�o enviadas para nenhum dos n�s Tomcat, sendo respondidas pelo pr�prio mod_jk.

O cluster em si � definido pelo arquivo de configura��o do mod_jk, chamado worker.properties e apresentado na Listagem 2. Observe a entrada balance_workers. Ela indica quais n�s fazem parte do cluster. Depois � configurada a p�gina de status, e por fim cada n� do cluster � configurado individualmente com seus par�metros de conex�o (no m�nimo, o endere�o IP e a porta TCP).

Os nomes utilizados para cada grupo de configura��es (worker.cluster, worker.status, worker.no1 e worker.no2) podem ser modificados livremente, desde que seja mantido o prefixo worker. Mas � necess�rio indicar a propriedade worker.list, que indica quais configura��es podem receber diretamente requisi��es redirecionadas pelas entradas JkMount na configura��o do Apache.

� poss�vel indicar, na configura��o do mod_jk, um �peso� (weight) para cada n� do cluster. O peso � utilizado para indicar o quanto de carga de trabalho um n� � capaz de receber em rela��o aos outros. Por exemplo, se um n� tem peso 2 e o outro tem peso 1, a cada tr�s requisi��es duas ir�o para o primeiro e uma para o segundo.

Configura��o do Tomcat

Cada instala��o do Tomcat dever� ter seu arquivo server.xml configurado conforme a Listagem 3. Note que o identificador do n� (jmvRoute) tem que ser consistente com o nome do n� na configura��o do mod_jk, para que o recurso de sticky sessions funcione. Note tamb�m que cada servidor Tomcat deve indicar uma porta TCP diferente no elemento Server. Esta porta � usada unicamente para o shutdown do servidor. Ent�o o servidor Tomcat com identificador no1 usa as portas 8105, 8180 e 8109 respectivamente para o desligamento do servidor, o conector Coyote (HTTP) e o conector Jk (AJP). J� o servidor no2 usa as portas 8205, 8280 e 8209.

Balanceando usu�rios versus requisi��es

Observe que esta configura��o poder� n�o fazer um balanceamento perfeito da carga de trabalho. Por estar utilizando sticky sessions, ela ir� balancear a cria��o de sess�es, ou seja, os usu�rios e n�o as requisi��es individuais destes. Desse modo, a carga de trabalho real em cada servidor poder� ficar bastante desigual.

� poss�vel configurar o mod_jk para fazer o balanceamento baseando-se na largura de banda consumida por cada n�, o que em teoria geraria uma utiliza��o mais uniforme dos n�s. Mais adiante, quando mostrarmos a configura��o da replica��o de sess�es, ser� poss�vel desligar o recurso de sticky sessions, de modo que ser�o balanceadas as requisi��es individuais.

Na verdade, n�o � poss�vel determinar a priori qual configura��o ir� distribuir a carga de trabalho de modo mais homog�neo entre os n�s do cluster. O ganho obtido por desligar sticky sessions ...

Quer ler esse conteúdo completo? Tenha acesso completo

Tecnologias:

Confira outros conte�dos:

Introdu��o ao JDBC

Novidades do Java

Teste unit�rio com JUnit

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Fernando Em 2008

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Clusters Web com Tomcat: Distribui��o de Carga e Alta Disponibilidade

Aprenda a configurar v�rios servidores Tomcat como um cluster, de modo a atender mais usu�rios e ocultar deles panes em algum dos servidores.