Alta disponibilidade com GNU/Linux - Revista Infra Magazine 2

Aten��o: esse artigo tem um v�deo complementar. Clique e assista!

Do que se trata o artigo:

Este artigo trata de como planejar e executar as configura��es necess�rias para montar uma estrutura de alta disponibilidade para servi�os, quer sejam de Internet ou n�o, utilizando GNU/Linux.

Para que serve:

Serve para garantir que os servi�os (banco de dados, servidores web etc.) estejam dispon�veis para uso pelos Clientes mesmo quando da ocorr�ncia de problemas graves, tais como instabilidade ou falhas de hardware.

Em que situa��o o tema � �til:

Quando voc� for respons�vel por manter um servi�o que n�o pode parar (24 h e 7 d) e/ou o mesmo tiver um alto n�mero de acessos e voc� desejar minimizar os impactos que uma manuten��o ou problema de hardware venha causar.

No ambiente atual, a demanda para que os servi�os estejam dispon�veis 24x7 � maior e cada vez mais presente em todos os segmentos, da ind�stria ao varejo. Se antes era um requisito existente ou recurso dispon�vel apenas para grandes ambientes, por conta de seu custo, hoje j� � poss�vel torn�-lo acess�vel para uma audi�ncia muito maior atrav�s de ferramentas open source.

Neste contexto, este artigo apresentar� como implementar um ambiente de alta disponibilidade utilizando apenas solu��es open source. Contudo, antes de apresentarmos as ferramentas que est�o � nossa disposi��o, � preciso introduzir alguns termos comuns na �rea e esclarecer os limites da solu��o proposta.

Alta disponibilidade e escalabilidade

A alta disponibilidade e escalabilidade s�o requisitos desej�veis em qualquer sistema, e apesar de serem vistas com frequ�ncia juntas, as solu��es que visam prover alta disponibilidade n�o implicam em escalabilidade e vice-versa. Para fins deste artigo, podemos definir que:

� Alta disponibilidade � a capacidade de um sistema/servidor estar dispon�vel por grandes per�odos de tempo;

� Escalabilidade � a capacidade de oferecer servi�os com qualidade aceit�vel mesmo com uma demanda crescente.

Este artigo abordar� apenas o primeiro item, uma vez que o segundo requer um conhecimento muito mais espec�fico da aplica��o que se deseja atender.

Paralisa��es

Uma vez que um servi�o � colocado � disposi��o dos usu�rios, uma press�o, antes inexistente, se manifesta: o servi�o deve estar dispon�vel sempre que necess�rio!

Infelizmente, em qualquer ambiente temos que conviver com eventos que atuam para impedir o objetivo acima de ser satisfeito. Estes eventos s�o as paralisa��es dos servidores/servi�os.

Para minimizarmos seus impactos temos que entender os tipos de paralisa��es. Estas podem ser divididas em duas categorias:

� N�o planejadas: s�o o resultado de falhas aleat�rias (imprevis�veis) dos sistemas, associadas a componentes de hardware ou software. Como exemplo, temos discos r�gidos com defeitos f�sicos, mem�rias com erros, fontes de alimenta��o queimadas, entre outros;

� Planejadas (ou manuten��es): associadas a paralisa��es agendadas para promover a atualiza��o de hardware ou software. Costumam oferecer menor impacto ao neg�cio por normalmente serem realizadas em momentos de menor tr�fego.

No caso das paralisa��es n�o planejadas, voc� pode ter uma postura preventiva, trocando, por exemplo, componentes antes do tempo m�dio do aparecimento de problemas. Entretanto, tal atitude n�o � uma garantia de que o componente n�o apresentar� problemas antes dessa data.

Mas qual o impacto de uma paralisa��o? Apesar de n�o ser f�cil quantificar o preju�zo de uma paralisa��o, � poss�vel realizar um simples exerc�cio para se entender o potencial que um problema pode alcan�ar.

Suponha que voc� tenha um servidor que demora 5 minutos para completar o processo de reinicializa��o. Se ele � respons�vel por atender a 100 requisi��es por segundo, isso significa que teremos 5 minutos x 60 segundos x 100 requisi��es por segundo = 30.000 requisi��es n�o atendidas!

N�veis de disponibilidade

Apesar do desejo de termos uma disponibilidade de 100%, este valor n�o � realiz�vel na pr�tica. Por conta disso, precisamos definir qual o n�vel de disponibilidade, conhecido como SLA (Service Level Agreement � que define os n�veis aceit�veis para um servi�o), antes de desenharmos a nossa solu��o.

Um SLA � um acordo negociado entre duas partes, onde uma � o Cliente e outra � o fornecedor de um servi�o. Ele registra os par�metros m�nimos de qualidade sobre servi�os, prioridades, responsabilidades e garantias.

Usualmente iniciamos estimando o tempo m�ximo desej�vel de parada (downtime) durante um ano de opera��o medido em minutos, e encontramos qual a classe de disponibilidade que satisfaz o requisito utilizando a seguinte f�rmula:


  D = (1 - R) x 365 x 24 x 60

Onde D � o tempo m�ximo de parada em minutos e R � a raz�o entre o tempo dispon�vel e o indispon�vel. No mercado � comum encontrarmos os n�veis conforme a Tabela 1.

Disponibilidade (%)	Tempo de parada no ano
99	3,65 dias
99,9	8,76 horas
99,99	52,6 minutos
99,999	5,26 minutos
99,9999	30 segundos

Tabela 1. N�veis de disponibilidade

Como atingir a alta disponibilidade?

Uma das maneiras de se atingir a alta disponibilidade est� em se desenvolver ou utilizar sistemas tolerantes a falhas. Nestes sistemas, a falha de um componente n�o afeta a opera��o, pois � compensada por outro de maneira transparente e autom�tica.

Se considerarmos apenas o contexto de hardware, os sistemas tolerantes a falhas, normalmente propriet�rios, possuem partes redundantes, ou seja, componentes adicionais que s�o acionados quando o principal apresenta falha. Nesta categoria encontramos CPUs, mem�ria, disco, fontes de alimenta��o e refrigera��o.

Por sua caracter�stica propriet�ria, os sistemas tolerantes a falhas possuem custos elevados, o que impede a sua ado��o fora de ambientes nos quais recursos de pessoal t�cnico ou financeiros sejam abundantes. Ou pelo menos impedia at� o lan�amento de projetos como o Linux HA (Linux High Availability � � um conjunto de ferramentas dispon�veis para ambiente GNU/Linux).

O Linux HA foi criado em 1998 e re�ne v�rios subprojetos de software que visam trazer a alta disponibilidade ao ambiente GNU/Linux. Ele tem como principal software o pacote Heartbeat.

Com o Linux HA temos acesso a solu��es, via software, para alcan�ar os n�veis de disponibilidade sem trazer os altos custos de solu��es propriet�rias.

Construindo a solu��o de disponibilidade

Para a constru��o de nossa solu��o nos basearemos na redund�ncia de componentes comuns (commodity hardware � hardware comum encontrado no mercado) e de software para detectar a falha e promover a recupera��o autom�tica.

Neste artigo assumiremos um ambiente exemplo como visto na Figura 1. Em nosso ambiente temos um servidor WWW, que serve os arquivos e aplicativos de nossa empresa para o mundo.

Figura 1. Servidor WWW.

Obviamente, como temos apenas um servidor, qualquer mau funcionamento nele que acarrete uma paralisa��o, programada ou n�o, ir� impedir que os usu�rios acessem os aplicativos l� hospedados.

A primeira abordagem que podemos assumir � duplicar o hardware e de alguma maneira sincronizar o conte�do de ambos os servidores. Na Figura 2 podemos ver tal abordagem utilizando uma ferramenta comum no ambiente Unix, o rsync.

O rsync � uma ferramenta que permite sincronizar o conte�do de disco (parti��es, arquivos, etc.) remotamente e de maneira eficiente. Ele s� leva as mudan�as que aconteceram entre uma sincroniza��o e outra. Assim, se voc� faz uma sincroniza��o a cada cinco minutos, ele s� leva as mudan�as ocorridas nesse per�odo, em vez de copiar todo o conte�do novamente.

Dessa forma, se seu site est� configurado para apontar para o IP A e o servidor apresenta problema, voc� pode reconfigurar a m�quina reserva para usar o mesmo IP e assim seus usu�rios voltar�o a acessar o conte�do � pelo menos o que existia at� a �ltima sincroniza��o (ver Figura 3).

Figura 2. Redund�ncia com o rsync.

Figura 3. Servidor backup em a��o.

A solu��o anterior funciona em alguns ambientes, mas possui muitos limitantes para a realidade pretendida:

� A sincroniza��o � peri�dica. Com isso, todos os dados atualizados entre uma sincroniza��o e outra s�o perdidos em caso de falha; ou seja, se o servidor de backup sincroniza a cada 1 hora e o principal ficar inacess�vel nesse intervalo, voc� colocar� o servidor de backup com dados incompletos em seu lugar;

� A configura��o � manual. A troca do IP do servidor backup e inicializa��o dos servi�os � manual. Isso representa um tempo para recupera��o elevado.

Tais restri��es nos impendem de alcan�ar n�veis de SLA aceit�veis para a maioria das necessidades. Dessa forma, precisamos utilizar outra abordagem que partir� do mesmo princ�pio (redund�ncia de hardware), mas se valer� de dois componentes do Linux HA: DRBD (Distributed Replicated Block Device) e o Heartbeat para resolver as limita��es vistas com a proposta do rsync.

O DRBD se apresenta para o sistema operacional como um sistema de blocos, assim como um disco r�gido. A diferen�a � que quando o sistema operacional manda escrever nesse dispositivo ele o faz via rede em um dispositivo remoto. Da� o seu car�ter distribu�do. Por se apresentar como um sistema de blocos ele � transparente para o sistema operacional, que acredita estar gravando localmente como em qualquer dispositivo.

O Heartbeat, por sua vez, � o nosso agente de monitoramento. Ele fica monitorando os elementos que ir�o compor nossa solu��o e ao detectar que o elemento considerado ativo (prim�rio) n�o est� respondendo, ele se encarrega de promover o elemento passivo (secund�rio) de maneira que o mesmo assuma todos os servi�os do elemento ativo.

Nossa meta � criar um ambiente que permita em at� 30 segundos detectar a falha e automaticamente possibilitar que o servidor backup assuma os servi�os oferecidos pelo servidor principal.

Anatomia da solu��o

Neste artigo iremos montar um ambiente de alta disponibilidade para um servidor Web. Nossa solu��o, vista na Figura 4, � composta de quatro componentes:

1. Um servidor prim�rio � sistema operacional Linux, com duas interfaces de rede e respons�vel inicialmente por prover o servi�o de Web atrav�s do Apache;

2. Um servidor secund�rio � sistema operacional Linux, com duas interfaces de rede;

3. Um barramento de rede principal ou p�blico � � o barramento de rede pelo qual os Clientes ir�o acessar o servidor;

4. Um barramento de rede secund�rio ou privado � � o barramento interno, utilizado apenas para a sincroniza��o (replica��o) dos dados do servidor prim�rio para o secund�rio.

Figura 4. Solu��o com DRBD+Heartbeat

Na solu��o usando o DRBD+Hearbeat resolvemos as duas restri��es citadas anteriormente (ver Figuras 2 e 3):

� Sincroniza��o dos dados transparente. Por se comportar como um disco convencional para o sistema operacional (DRBD), toda e qualquer opera��o de escrita � transmitida para o ponto secund�rio automaticamente e de maneira s�ncrona;

� Configura��o autom�tica. O Hearbeat ao perceber que o ponto prim�rio n�o est� operante, faz com que o n� secund�rio assuma o seu papel realizando configura��es, como de IP, de forma autom�tica.

Na Figura 5 vemos o que acontece quando ocorre a falha do ponto prim�rio. O servidor B ir� assumir o papel do n� prim�rio, passando a responder pelo IP C (associado ao servi�o www.dominio.com.br) e iniciar� o servidor Apache localmente.

Figura 5. Falha no servidor prim�rio.

Configurando o ambiente

Em nosso exemplo estamos montando uma solu��o HA para um servidor Web. Usaremos nos dois servidores o sistema operacional Linux com a distribui��o CentOS 5.x, os pacotes do Apache, DRBD e o Heartbeat.

Para baixar estas aplica��es, acesse os endere�os listados no final do artigo na se��o Links.

Apesar dos procedimentos de instala��o diferirem quanto � distribui��o escolhida, todos os pacotes s�o encontrados nas distribui��es mais recentes.

Para montar um ambiente, usaremos como exemplo os par�metros abaixo:

Servidor A

Interface p�blica: 172.16.117.162 / 255.255.255.0

Interface privada: 192.168.0.2 / 255.255.255.0

Nome: node0

Servidor B

Interface p�blica: 172.16.117.163 / 255.255.255.0

Interface privada: 192.168.0.3 / 255.255.255.0

Nome: node1

IP p�blico do servi�o Web

172.16.117.160

� importante que em ambos os servidores o servi�o do Apache esteja configurado para n�o se iniciar automaticamente. Esse controle ser� feito pelo Heartbeat.

Agora realize as etapas descritas a seguir nos dois servidores, salvo onde explicitamente for indicado para realizar apenas no servidor prim�rio.

1� Etapa: configurando o DRBD

O DRBD � respons�vel pela sincroniza��o dos dados entre os n�s. � desta maneira que � poss�vel us�-lo sem que as aplica��es que fazem uso daquela parti��o tenham que ser modificadas para se beneficiar da replica��o.

O arquivo de configura��o do DRBD padr�o � o /etc/drbd.conf. Usualmente � criado um de exemplo no processo de instala��o do pacote. Em nosso exemplo teremos o arquivo apresentado na Listagem 1.

Listagem 1. Arquivo de configura��o do DRBD.


  resource apache
  {
    protocol C;
    startup { wfc-timeout 0; degr-wfc-timeout     120; }
    disk { on-io-error detach; }
    net {  cram-hmac-alg "sha1"; shared-secret �senha"; }
    syncer { rate 10M; }
   
    on node0 {
      device /dev/drbd0;
      disk /dev/sdb;
      address 192.168.0.2:7788;
      meta-disk internal;
    }
   
    on node1 {
      device /dev/drbd0;
      disk /dev/sdb;
      address 192.168.0.3:7788;
      meta-disk internal;
    }
  }

A explica��o sobre o funcionamento de todos os par�metros est� al�m do escopo deste artigo. No entanto, analisaremos alguns dos par�metros gerais, isto �, que afetam todos os recursos do DRBD. Protocol representa o protocolo de controle do status das opera��es. Ele possui tr�s op��es: A, B ou C. O status indica se a opera��o de escrita pode ser considerada completa em ambos n�s. Cada protocolo, dentre as op��es, oferece mais ou menos seguran�a quanto a considerar a opera��o conclu�da. No protocolo A, a replica��o acontece em modo ass�ncrono, ou seja, as opera��es de escrita s�o consideradas conclu�das quando s�o realizadas no disco local. A ordem de escrita no n� remoto � colocada em uma fila para transmiss�o na rede. Se ocorrer um erro neste momento � poss�vel haver perda de dados j� que os comandos de escrita n�o chegar�o ao n� remoto. No protocolo B, a replica��o acontece em modo semi-s�ncrono, ou seja, as opera��es de escrita s�o consideradas conclu�das quando s�o realizadas no disco local e a ordem de escrita no n� remoto chegam ao destino. Ainda � poss�vel haver perda de dados no caso de uma falha simult�nea dos n�s antes que o n� remoto tenha escrito no seu disco. No protocolo C, a replica��o acontece em modo s�ncrono, ou seja, as opera��es de escrita s�o consideradas conclu�das quando ambos os discos (do n� local e remoto) confirmam a grava��o dos dados. Assim, escolhemos o protocolo C, pois � o que d� mais garantia quanto � integridade dos dados. Startup indica par�metros utilizados na inicializa��o do DRBD. Em nosso caso, wfc-timeout indica o tempo que um n� deve esperar at� que o outro n� sinalize estar operacional antes de inicializar o DRBD. Este par�metro � usado pelo n� sendo inicializado se ele estivesse ativo anteriormente e ap�s um reboot n�o conseguisse conectar ao outro n�. O valor 0 indica que o n� dever� aguardar indefinidamente ou at� uma interven��o manual antes de inicializar o dispositivo. O degr-wfc-timeout � usado em uma situa��o diferente. Se um n� A estiver inicializando e antes do boot atual o n� B com o qual ele se comunica j� estivesse inoperante, o n� A deveria aguardar pelo tempo indicado antes de iniciar o dispositivo DRBD. Em nosso cen�rio, caso o n� B estivesse fora antes do n� A realizar um reboot, este deveria esperar 120 segundos antes de inicializar os dispositivos. Disk indica como tratar os avisos que o dispositivo f�sico reporta ao DRBD. Em nosso caso, se detectar erros de opera��o de entrada/sa�da dever� desconectar o dispositivo f�sico. Syncer indica a velocidade dispon�vel para o DRBD utilizar na replica��o. A velocidade � um fator influenciado pela capacidade de entrada/sa�da do dispositivo f�sico (disco r�gido/controladora/barramento de dados) e a interface de rede. Como regra geral, sugere-se limitar em 30% da capacidade nominal de transfer�ncia. Por exemplo: suponha que seu sistema de discos suporte uma vaz�o de 110 MB/s (MBytes/s) e voc� use uma interface Gigabit na rede de replica��o. A taxa a ser usada seria 110 x 0.3 = 33 M. Net define o algoritmo usado para a autentica��o entre os dois n�s e qual a senha que usaremos. � uma medida de seguran�a para evitar que outros equipamentos possam se conectar e interagir de forma n�o autorizada. Enquanto os par�metros anteriores ditam o comportamento geral do n�, temos que definir como os recursos de disco ser�o usados pelo sistema. Vamos analisar alguns dos par�metros para a defini��o dos recursos que ser�o oferecidos pelo DRBD. O primeiro par�metro a ser visto � o resource. Cada resource deve ser pensado como um nome associado a uma parti��o de um disco r�gido. Da mesma maneira que voc� pode criar alias (apelido) para discos f�sicos em sua configura��o, um resource � um indicador que voc� usar� de agora em diante para todos os comandos de manipula��o do DRBD. Voc� pode ter v�rios recursos dentro do DRBD. No sistema operacional (e no Heartbeat) voc� ir� referenciar a eles atrav�s de um nome para facilitar a execu��o de comandos. Em nossa solu��o, definimos um recurso chamado apache:


  resource apache

Na sequ�ncia definimos os n�s. Abaixo apresentamos um fragmento do mesmo arquivo de configura��o, com foco apenas nos par�metros que definem um recurso:


  on node0 {
      device /dev/drbd0;
      disk /dev/sdb;
      address 192.168.0.2:7788;
      meta-disk internal;
    }
   
  on node1 {
      device /dev/drbd0;
      disk /dev/sdb;
      address 192.168.0.3:7788;
      meta-disk internal;
    }

Em nosso caso temos no primeiro n� (node0) um dispositivo /dev/drbd0 que � mapeado para o disco f�sico /dev/sdb, e vemos que ele fica escutando no IP 192.168.0.2 na porta 7788.

Ao observarmos o segundo n�, vemos que com exce��o do IP, que � o IP privado do servidor B, as demais configura��es s�o as mesmas.

Para entendermos o que foi feito � preciso explicar que, em nosso exemplo, existe um segundo disco (/dev/sdb) em cada servidor e que criamos em cada n� um dispositivo (/dev/drbd0) que gravar� e ler� os dados desse disco.

O nosso sistema operacional ir� gravar na parti��o drbd0 achando que se trata de um disco f�sico local (como /dev/sda) e os dados ser�o replicados para o n� que estiver em modo secund�rio de forma autom�tica. Assim, se houver uma pane no servidor prim�rio, o segundo ter� uma c�pia exata dos dados at� o momento anterior da pane.

Ap�s criar o arquivo de configura��o, copie o mesmo manualmente para o segundo servidor (j� que ele � id�ntico) e execute como usu�rio root o comando a seguir na console dos dois servidores:


   drbdadm create-md apache

O drbdadm � um utilit�rio que � instalado com o DRBD e lhe permitir� consultar e alterar o comportamento do n�, se necess�rio.

Neste ponto, o DRBD ir� iniciar o processo de inicializa��o do dispositivo /dev/drbd0, conforme a Listagem 2.

Listagem 2. Processo de inicializa��o do dispositivo drbd0.


  v08 Magic number not found
  v07 Magic number not found
  About to create a new drbd meta data block on /dev/sdb.
   . ==> This might destroy existing data! <==
  Do you want to proceed? [need to type 'yes' to confirm] yes
  Creating meta data... initialising activity log NOT initialized bitmap (256 KB) New drbd meta data block sucessfully created.

O tempo necess�rio para esse procedimento depender� do tamanho do disco (ou parti��o) usado.

Agora voc� deve iniciar o servi�o do DRBD com o comando:


  service drbd start

Se ocorreu tudo bem, ambos os n�s estar�o marcados como secund�rios. Ent�o execute o comando abaixo em ambos os servidores:


  cat /proc/drbd

Ele ir� mostrar o status do sistema de controle do DRBD para que voc� veja como se encontram os dispositivos criados, qual o papel de cada dispositivo (prim�rio/secund�rio) no servidor onde o comando foi executado e se est� sincronizado ou n�o.

O resultado apresentado na Listagem 3 indica que o dispositivo do DRBD foi criado e que ambos os n�s est�o no modo secund�rio.

Listagem 3. O processo de inicializa��o do drbd0 foi conclu�do.


  version: 8.0.4 (api:86/proto:86) SVN Revision: 2947 build by buildsvn@c5-i386-build, 2007-07-31 19:17:18
   . 0: cs:Connected st:Secondary/Secondary ds:Inconsistent/Inconsistent C r---
    . ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0
     . resync: used:0/31 hits:0 misses:0 starving:0 dirty:0 changed:0 act_log: used:0/257 hits:0 misses:0 starving:0 dirty:0 changed:0

Agora voc� deve escolher um dos dois n�s para considerar como prim�rio. Como ambos neste momento n�o possuem nenhum conte�do, na pr�tica voc� pode selecionar qualquer um deles. Para padronizarmos, iremos executar o comando abaixo no node0:


  drbdadm -- --overwrite-data-of-peer primary apache

O comando ir� instruir o servidor onde ele foi executado; em nosso caso node0, que ele deve copiar o conte�do dos blocos do disco do servidor prim�rio para o secund�rio.

Como no DRBD n�s associamos um nome a cada parti��o criada, estamos fazendo isso para o resource apache. Caso voc� tivesse mais de um resource, voc� deveria faz�-lo para todos os resources existentes.

Agora, se repetirmos o cat /proc/drbd a partir do node0, devemos ver o resultado exibido na Listagem 4.

Listagem 4. Processo de sincroniza��o entre o n� prim�rio e secund�rio.


  0: cs:SyncTarget st:Primary/Secondary ds:Inconsistent/Inconsistent C r---
    . ns:0 nr:68608 dw:68608 dr:0 al:0 bm:4 lo:0 pe:0 ua:0 ap:0
     . [>...................] sync'ed:  0.9% (8124/8191)M finish: 0:12:05 speed: 11,432 (11,432) K/sec resync: 
      used:0/31 hits:4283 misses:5 starving:0 dirty:0 changed:5 act_log: used:0/257 hits:0 misses:0 starving:0 
      dirty:0 changed:0

Neste momento ele indica que est� realizando o processo de sincroniza��o entre o servidor prim�rio e o secund�rio. No exemplo da Listagem 4 o DRBD se encontra em 0.9% da sincroniza��o e estima que necessitar� de mais 12 minutos e 5 segundos para concluir. O tempo real depender� do tamanho e performance dos discos de cada servidor e da rede.

Quando o DRBD concluiu o processo de sincroniza��o voc� ficou com dois dispositivos, um em cada n�, com o mesmo conte�do de cada bloco do disco f�sico. Os blocos est�o, entretanto, sem nenhuma formata��o espec�fica. Para poder usar o disco para armazenar o conte�do voc� precisa formatar a parti��o.

Deste modo, quando o valor estiver em 100%, execute o seguinte comando no node0:


  mkfs.ext3 /dev/drbd0

Feito isso, voc� j� pode montar a parti��o e come�ar a us�-la.


  mkdir /mnt/apache
  mount /dev/drbd0 /mnt/apache

Com isso j� conseguimos resolver metade de nosso objetivo. Tudo que venha a ser escrito em /mnt/apache ser� replicado automaticamente no node1.

Para darmos continuidade ao processo, iremos desmontar a parti��o /dev/drbd0 recentemente criada. A fun��o do Heartbeat ser� gerenciar e cuidar de montar e desmontar as parti��es automaticamente. Para isso, execute:


  umount /mnt/apache

O pr�ximo passo � configurar o Heartbeat para que monitore o sistema e promova o servidor secund�rio a prim�rio, quando necess�rio.

2� Etapa: Configurando o Heartbeat

O Heartbeat � uma ferramenta de monitoramento bastante vers�til. Para a finalidade de nossa solu��o, estaremos interessados em tr�s arquivos de configura��o: /etc/ha.d/authkeys, /etc/ha.d/ha.cf e /etc/ha.d/haresources.

No /etc/ha.d/authkeys voc� ir� configurar um c�digo e uma senha que dever�o ser usados por ambos os n�s na comunica��o do Heartbeat:


  auth 1
  1 sha1 senha-do-heartbeat

O auth 1 indica o c�digo a ser usado para identificar os servidores que participar�o da comunica��o, e na linha seguinte qual a senha a ser usada para garantir que apenas os n�s participantes possam se identificar.

No /etc/ha.d/ha.cf voc� deve configurar os par�metros que ser�o usados pelo Heartbeat para monitorar os n�s e que crit�rios usar para tomar a decis�o se um n� est� operante ou n�o (Listagem 5).

Listagem 5. Configura��o do Heartbeat.


  keepalive 1
  deadtime 10
  warntime 5
  initdead 120
  udpport 694
  ping 172.16.117.1
  bcast eth1
  auto_failback off
  node    172.16.117.162
  node    172.16.117.163

Aqui os pontos principais s�o:

� deadtime: n�mero de segundos sem comunica��o a partir do qual o n� � considerado �morto�;

� ping: indica qual o endere�o IP que o Heartbeat ir� monitorar. Em nosso exemplo estamos monitorando o gateway;

� bcast: indica qual a interface de rede no qual os pacotes de controle do Heartbeat ser�o enviados;

� auto_failback: caso um n� seja detectado como morto e depois volte � atividade ele deve (ou n�o) ser auto promovido a prim�rio. Em nosso caso optamos por avaliar manualmente o evento e decidir qual n� deve ser o prim�rio em um caso desses;

� node: indica os IPs da rede p�blica onde o Heartbeat est� instalado.

A parte mais importante para nossa configura��o est� no �ltimo arquivo (haresources). � nele que indicaremos o que o Heartbeat dever� fazer quando detectar um problema e precisar elevar um n� de secund�rio para prim�rio e vice-versa:


  node0 IPaddr::172.16.117.160/24 drbddisk::apache   Filesystem::/dev/drbd0::/mnt/apache::ext3::defaults httpd

Em nosso exemplo estamos indicando que o n� que estiver como prim�rio dever� configurar o IP 172.16.117.160/255.255.255.0, montar a parti��o /dev/drbd0 como /mnt/apache e iniciar o servi�o httpd.

No manual do Heartbeat est�o descritas todas as op��es v�lidas, mas � importante entender que o processamento desse arquivo acontece na seguinte ordem:

� Da esquerda para a direita e de cima para baixo. Quando um n� est� sendo promovido a prim�rio ele inicia executando os comandos nessa sequ�ncia;

Ou:

� Da direita para a esquerda e de baixo para cima. Quando um n� est� sendo rebaixado de prim�rio para secund�rio ele inicia executando os comandos nessa sequ�ncia.

� importante que entendamos esta ordem e o porqu� dela antes de criarmos nosso haresources.

Quando um n� est� se ativando e for decidido que ele � prim�rio, ele ir� come�ar criando um alias com o IP indicado. Este IP � o nosso IP p�blico associado ao servidor Web www.dominio.com.br. Em seguida ele ir� montar a parti��o DRBD no diret�rio que n�s indicamos e s� depois ir� inicializar o servi�o do Apache. Ap�s a inicializa��o do Apache, quem tentar acessar o servi�o ir� visualizar a p�gina normalmente.

O n� secund�rio ficar� monitorando e, atrav�s do DRBD, sincronizando as modifica��es na parti��o criada.

Agora suponha que aconte�a algo com o n� prim�rio que o impe�a de se comunicar com o gateway, por exemplo: a porta do switch apresente problema ou o cabo de rede seja desconectado.

O Heartbeat detectar� este problema e ap�s 10 segundos avisar� ao n� secund�rio que ele deve ser promovido. Esse tempo de 10 segundos serve para evitar que pequenas interrup��es tempor�rias gerem falsos positivos e provoquem a altera��o desnecess�ria. Para isso o Heartbeat ir�, no atual n� prim�rio (node0), desligar o servi�o do Apache, desmontar a parti��o e remover o alias do IP.

No node1 ele far� exatamente o que fez quando o node0 foi ativado, e desta maneira, em menos de 30 segundos, os usu�rios que estivessem acessando o site www.dominio.com.br seriam atendidos pelo novo servidor sem tomar conhecimento da mudan�a ou qualquer interven��o manual.

3� Etapa: Testando

Ao chegarmos nessa etapa j� temos todos os componentes respons�veis pela alta disponibilidade configurados. O que precisamos fazer agora � realizar ajustes no Apache para que ele trabalhe corretamente com nossa solu��o.

Deste modo, antes de efetuarmos os testes, existem dois passos necess�rios:

� Configurar o Apache para disponibilizar o conte�do da parti��o criada e n�o do lugar padr�o. Como o Apache por padr�o utiliza o diret�rio /var/www/html, � necess�rio alter�-lo para o /mnt/apache;

� Iniciar o Heartbeat em ambos servidores.

Primeiro configure o Apache para usar o /mnt/apache como DocumentRoot. Isso pode ser feito editando o arquivo de configura��o /etc/httpd/conf/httpd.conf. Assim, procure as entradas DocumentRoot e Directory que apontarem para /var/www/html e mude-as para /mnt/apache.

Em seguida inicie o Heartbeat em ambos os n�s. At� o momento ele estava configurado, mas n�o estava em uso.


  /etc/init.d/heartbeat start

Com isso, o Heartbeat ir� ler os arquivos de configura��o que apresentamos anteriormente e executar os comandos que criamos no arquivo haresources.

Neste momento, se observarmos no node0 as interfaces de rede atrav�s do comando ifconfig, � poss�vel notar que foi criado um alias (eth0:0) para a interface com o IP p�blico, como destaca a Listagem 6.

Listagem 6. Listagem das interfaces de rede e seus endere�os ap�s o Heartbeat iniciar o node0.


  eth0      Link encap:Ethernet  HWaddr 00:0C:29:DA:14:35  
  inet addr:172.16.117.162  Bcast:172.16.117.255  Mask:255.255.255.0
   
  eth0:0    Link encap:Ethernet  HWaddr 00:0C:29:DA:14:35  
  inet addr:172.16.117.160  Bcast:172.16.117.255  Mask:255.255.255.0
            
  eth1      Link encap:Ethernet  HWaddr 00:0C:29:DA:14:3F  
  inet addr:192.168.0.2  Bcast:192.168.0.255  Mask:255.255.255.0

� poss�vel ainda verificar que ele montou a parti��o que ir� conter o resultado, atrav�s do comando df:


  Filesystem           1K-blocks      Used Available Use% Mounted on
  /dev/drbd0              507696     10549    470936   3% /mnt/apache

Em seguida verifique que ele iniciou o servi�o do Apache. Use o comando ps �aux | grep httpd:


  4528 Ss /usr/bin/httpd
  4537 S  /usr/bin/httpd

Se observarmos o log do Heartbeat, podemos ver as opera��es sendo executadas e ele fazendo com que os recursos (IP, disco e servi�o) migrem de um n� para o outro. O log fica localizado em /var/log/messages (veja a Listagem 7).

Listagem 7. O Heartbeat associa o IP 172.16.117.160 ao n� ativo.


  node0 heartbeat: info: Local Resource acquisition completed.
  node0 harc: info: Running /etc/ha.d/rc.d/ip-request-resp ip-request-resp
  node0 ip-request-resp: received ip-request-resp IPaddr::172.16.117.160/24 OK yes
  node0 ResourceManager: info: Acquiring resource group: node0 IPaddr::172.16.117.160/24 drbddisk::apache 
  Filesystem::/dev/drbd0::/mnt/apache::ext3::defaults httpd
  node0 IPaddr: INFO:  Resource is stopped
  node0 ResourceManager: info: Running /etc/ha.d/resource.d/IPaddr 172.16.117.160/24 start

Na parte em negrito da Listagem 7 vemos que o Heartbeat come�ou a executar os comandos que configuramos no arquivo haresources. Note que o Heartbeat primeiro cria o alias com IP 172.16.117.160.

Listagem 8. O Heartbeat monta a parti��o para uso e inicia o Apache.


  node0 IPaddr: INFO: Using calculated nic for 172.16.117.160: eth0
  node0 IPaddr: INFO: Using calculated netmask for 172.16.117.160: 255.255.255.0
  node0 IPaddr: INFO: eval ifconfig eth0:0 172.16.117.160 netmask 255.255.255.0 broadcast 172.16.117.255
  node0 IPaddr: INFO:  Success
  node0 Filesystem: INFO:  Resource is stopped
  node0 ResourceManager: info: Running /etc/ha.d/resource.d/Filesystem /dev/drbd0 /mnt/apache ext3 defaults start
  node0 Filesystem: INFO: Running start for /dev/drbd0 on /mnt/apache
  node0 kernel: kjournald starting.  Commit interval 5 seconds
  kernel: EXT3 FS on drbd0, internal journal
  node0 kernel: EXT3-fs: mounted filesystem with ordered data mode.
  node0 Filesystem: INFO:  Success

Na Listagem 8 vemos que o Heartbeat montou a parti��o /dev/drbd0 como /mnt/apache. Ainda na Listagem 8, tamb�m notamos que o Heartbeat iniciou o servi�o do Apache para receber as requisi��es de p�ginas Web.


  node0 ResourceManager: info: Running /etc/init.d/httpd  start

Nesse momento, se voc� acessar o endere�o http://172.16.117.160, ver� o conte�do que estiver na parti��o /mnt/apache.

Para vermos a troca de identidades, ou seja, quem � o n� prim�rio (ativo) e quem � o n� secund�rio (passivo) basta desconectar o cabo de rede do servidor node0.

Ao fazer isso, o node1 assumir� o papel como n� prim�rio em poucos segundos. Depois acesse o servidor node1 e veja o conte�do do arquivo /var/log/messages.

Listagem 9. Log do servidor secund�rio no momento que o Heartbeat detecta que o outro n� est� inoperante.


  node1 heartbeat: info: Link node0:eth1 dead.
  node1 ipfail: info: Status update: Node node0 now has status dead
  node1 harc: info: Running /etc/ha.d/rc.d/status status
  node1 heartbeat: info: No local resources [/usr/share/heartbeat/ResourceManager listkeys node1] to acquire.

O log exibido na Listagem 9 ilustra o momento em que node1 detecta que node0 est� inoperante e com isso identifica que precisa se apoderar dos recursos.

Se voc� repetir os comandos vistos quando iniciamos o Heartbeat, mas agora no node1, ver� que ele assumiu o alias, montou a parti��o e iniciou o servidor apache.

Conclus�o

Ao longo deste artigo vimos como � poss�vel configurar dois servidores para prover um servi�o de alta disponibilidade, com tempo de parada inferior a 30 segundos, utilizando-se apenas de hardware convencional e de software livre.

Os conceitos vistos aqui podem ser utilizados essencialmente em qualquer servidor/servi�o. Servidores de arquivo (como Samba ou NFS) e ainda servidores de banco de dados s�o candidatos ideais e podem ser configurados para trabalhar nessa estrutura com um m�nimo de esfor�o.

A etapa mais importante � a de definir as a��es que o Heartbeat dever� executar ao iniciar um n� prim�rio e ao transferir os recursos para o secund�rio. Isso lhe permitir� identificar as modifica��es, se houver, nas configura��es dos servi�os a serem oferecidos e atingir padr�es de disponibilidade antes s� alcan��veis com grandes investimentos.

Tudo isso com recursos dispon�veis a qualquer um com uma conex�o � Internet e um pouco de dedica��o.

Links

Linux-HA
www.linux-ha.org

Planet HA
www.planet-ha.org

MySQL com DRBD
www.mysql.com/drbd

DRBD
www.drbd.org