Artigo da SQL Magazine 41 - Gerenciando um cluster PostgreSQL com PGCluster

ustify>

Clique aqui para ler todos os artigos desta edi��o

Gerenciando um cluster PostgreSQL com PGCluster

Uma forma simples e pr�tica de gerenciar bancos de dados PostgreSQL

Na sua forma mais b�sica, um cluster � um sistema que compreende dois ou mais computadores ou sistemas (denominados n�s) onde trabalham em conjunto para executar aplica��es ou realizar outras tarefas de tal forma que os usu�rios que os utilizam tenham a impress�o que somente um �nico sistema responde para eles (computador virtual). Este conceito � denominado transpar�ncia do sistema. Como caracter�sticas fundamentais para a constru��o destas plataformas incluem-se eleva��o da confian�a, distribui��o de carga e performance.

PGCluster � um sistema s�ncrono de replica��o de composi��o multi-master para PostgreSQL. Devido ao fato do sistema de replica��o ser um sistema s�ncrono, atrasos n�o ir�o ocorrer na duplica��o de dados entre os servidores de armazenamento. Em um servidor de composi��o multi-master, dois ou mais servidores de armazenamento podem ser acessados simultaneamente por um usu�rio.

Nesse artigo ser�o mostradas as possibilidades de uso do PGCluster como gerenciador de cluster bem como vantagens e desvantagens de cada possibilidade, o funcionamento interno, sua arquitetura, maneiras de configura��o e procedimento de recupera��o de dados.

Replica��o de dados

O objetivo de um mecanismo de replica��o de dados � permitir a manuten��o de v�rias c�pias de um mesmo dado em v�rios servidores de banco de dados (SGBD). Os principais benef�cios da replica��o de dados s�o:

� redund�ncia, o que torna o sistema menos sens�vel �s falhas;

� possibilidade de balanceamento de carga do sistema, j� que o acesso pode ser distribu�do entre as r�plicas;

� e finalmente, ter-se um backup on-line dos dados, j� que todas as r�plicas estariam sincronizadas.

Existem basicamente dois tipos de replica��o: a replica��o ass�ncrona e a s�ncrona. Na replica��o ass�ncrona (armazena e faz a replica��o), a c�pia dos dados fica fora de sincronia entre os bancos de dados. Se um banco � alterado, a altera��o ser� propagada e aplicada para outro(s) banco(s) num segundo passo, dentro de uma transa��o separada sendo que esta poder� ocorrer segundos, minutos, horas ou at� dias depois. A c�pia poder� ficar temporariamente fora de sincronia, mas quando a sincroniza��o ocorrer, os dados convergir�o para os locais especificados.

Na replica��o s�ncrona, todas as c�pias ou replica��es de dados ser�o feitas no instante da sincroniza��o e consist�ncia. Se alguma c�pia do banco � alterada, essa altera��o ser� imediatamente aplicada a todos os outros bancos dentro da transa��o. Os servidores replicados cooperam usando estrat�gias sincronizadas e protocolos especializados de r�plica para manter os conjuntos de dados replicados coerentes. A replica��o s�ncrona � apropriada em aplica��es comerciais onde a consist�ncia exata das informa��es � de extrema import�ncia. Esse � o tipo de replica��o abordada pelo PGCluster.

Na pr�xima se��o ser� apresentado, em mais detalhes, como funciona o PGCluster e o processo interno de replica��o.

PGCluster

O PGCluster � um sistema de replica��o s�ncrona de composi��o multi-master, e que pode trabalhar de duas maneiras principais: compartilhamento de acesso e alta disponibilidade.

No caso do compartilhamento de acesso, a partir da combina��o de servidores de armazenamento e servidor de replica��o pode-se criar um sistema onde ser� poss�vel minimizar a carga do acesso e fazer consultas de maneira distribu�da pelo cluster. Com a adi��o de um balanceador de carga (servidor respons�vel por distribuir a carga de acesso ao cluster), o PGCluster configura um sistema de alta disponibilidade. O balanceador de carga e o servidor de replica��o separam um n� que ocasionalmente falhe e continuam a servir com o restante do sistema. Assim que a m�quina que falhou for restabelecida, os dados s�o copiados para ela automaticamente. O mesmo acontece com um novo n� que venha a se integrar ao sistema.

Arquitetura geral do sistema

A query de uma transa��o � replicada de dois modos: normal e confi�vel. A diferen�a entre os dois � que no modo normal uma resposta � enviada ao front-end (aplica��o que gerou a altera��o no banco) ap�s a execu��o da query no servidor de armazenamento ao qual a mesma foi destinada. J� no modo confi�vel, a resposta � enviada ap�s a query ter sido executada em todos os servidores de armazenamento, ou seja, ap�s a modifica��o ter sido replicada para todos os n�s envolvidos. Graficamente, a diferen�a entre os dois modos � evidenciada pelas Figuras 1 e 2.

Figura 1. Fluxo das transa��es da replica��o (Modo Normal).

A Figura 1 mostra os servidores que formam o cluster. Balanceador de carga (LB), servidores de armazenamento (DB1, DB2 e DB3), e servidor de replica��o (Rep). Nesse fluxo, a solicita��o de altera��o do banco � enviada inicialmente ao balanceador de carga, que direciona para o servidor de armazenamento com menos carga (com base no n�mero de sess�es abertas e em andamento). Ent�o, o servidor de replica��o envia a altera��o para todos os outros servidores de armazenamento.

Figura 2. Fluxo das transa��es da replica��o (Modo Confi�vel).

De maneira similar, na Figura 2, o modo de replica��o confi�vel segue o mesmo fluxo, por�m s� envia a resposta ap�s a altera��o ter sido replicada em todos os servidores de armazenamento do cluster.

...

Quer ler esse conteúdo completo? Tenha acesso completo