Introdu��o a Replica��o e alta disponibilidade no PostgreSQL

Clique aqui para ler esse revista em PDF.

Clique aqui para ler todos os artigos desta ediç�o

Replicaç�o e alta disponibilidade no PostgreSQL

Carlos Eduardo Smanioto

Neste artigo introdut�rio iremos falar sobre algo que � de grande utilidade para os desenvolvedores e DBAs: m�ltiplas inst�ncias do nosso banco de dados para alta disponibilidade, backup ou migraç�o de vers�o no-downtime (sem queda do oferecimento da informaç�o). Estas s�o algumas vantagens da replicaç�o com alta disponibilidade.

Neste primeiro artigo vamos explorar o Slony, um software de replicaç�o que em conjunto com outras ferramentas do Linux se torna um forte aliado na alta disponibilidade de servidores PostgreSQL.

Como nas outras vezes, este artigo exige um pouco de conhecimento de instalaç�o do PostgreSQL a partir do c�digo fonte. Foi explicado algo sobre isso nos artigos de tuning do PostgreSQL no Linux (ediç�es 12, 14 e 19 da SQL Magazine).

Entendendo o que � replicaç�o

� a c�pia (transmiss�o) de informaç�es de uma ou mais bases de dados para outra estrutura semelhante. No caso dos SGBDs, � a duplicaç�o de uma determinada �aç�o� em base de dados separadas logicamente e/ou geograficamente. Em outras palavras, replicaç�o � a sincronizaç�o de aç�es de um SGBD em duas ou mais bases de dados com a mesma estrutura, podendo ser na mesma m�quina replicando com ela mesma (separadas logicamente) ou em m�quinas distintas (separadas por pontos geogr�ficos).

Toda sincronizaç�o � realizada no instante em que a informaç�o se torna consistente no SGBD. Quando isso acontece, podemos ter dois tipos de sincronizaç�o: s�ncrona e ass�ncrona.

Replicaç�o s�ncrona (sincronizada)

Neste tipo de sincronizaç�o, a replicaç�o da aç�o � feita instantaneamente. Se alguma c�pia do banco � alterada, essa alteraç�o ser� imediatamente aplicada a todos os outros bancos dentro da transaç�o. A replicaç�o s�ncrona � apropriada em aplicaç�es comerciais onde � exigido um n�vel de atualizaç�o muito preciso em todos os servidores envolvidos.

Desvantagem

Existem algumas desvantagens neste tipo de replicaç�o. Mas, dentre as principais, podemos citar:

�Perda sens�vel da performance;

Uma das grandes explicaç�es para isso � que ao executar uma aç�o na base �central�, ela ir� instantaneamente replicar para as demais dentro da mesma transaç�o do usu�rio, ou seja, a aç�o n�o retorna o �ok final� para o usu�rio que executou a aç�o sem que as demais bases estejam atualizadas. Veja o exemplo na Listagem 1.

# Cliente executando um insert:

Insert into teste(1,2,3);

#SGBD replicando o comando no modelo s�ncrono:

Begin

Insert into teste(1,2,3);

Replicar();

end;

Listagem 1. Representaç�o de replicaç�o s�ncrona.

Replicar() � um comando de replicaç�o interno hipot�tico. O importante � imaginar aqui que o cliente fica esperando o �end.� da transaç�o para obter novamente o controle da aplicaç�o. Isso porque a maioria das ferramentas de replicaç�o s�ncrona utiliza triggers para chamar o agente replicador.

�Exige um meio de transmiss�o de dados de alta velocidade com padr�o de qualidade superior ao modelo de replicaç�o ass�ncrona;

Como d� para imaginar, o sucesso deste modelo exige m�todos de transmiss�o de dados de grande efic�cia e efici�ncia. Dificilmente ser� poss�vel, por exemplo, utilizar uma assinatura ADSL �padr�o� oferecido pelas empresas de telefonia brasileiras. Ser�o necess�rios serviços espec�ficos e, dependendo muito do �volume di�rio de dados replicado�, uma grande quantidade de banda.

Replicaç�o ass�ncrona (n�o sincronizada)

Neste modelo a replicaç�o n�o � instant�nea. O replicador monta um hist�rico das aç�es a serem replicadas e em um determinado momento � feita a replicaç�o entre as bases de dados relacionadas. A alteraç�o ser� propagada e aplicada para outra base em um segundo passo, dentro de uma transaç�o separada. Esta poder� ocorrer em segundos, minutos, horas ou at� dias depois, dependendo da configuraç�o pr�-estabelecida.

Desvantagem

�Consumo de recursos das m�quinas envolvidas acima do normal no momento da replicaç�o;

Isso � um fator negativo, pois o SGBD perde o poder de resposta nos momentos que est� replicando. Logicamente, esta � uma verdade apenas para grandes volumes de dados.

�As informaç�es nas m�quinas envolvidas n�o estar�o o tempo todo atualizadas.

Este � um dos grandes problemas da replicaç�o, as m�quinas envolvidas na replicaç�o ficar�o desatualizadas at� que o processo de replicaç�o seja iniciado.

Soluç�es de replicaç�o no PostgreSQL

Vamos estudar um pouco de cada soluç�o de replicaç�o. Conhecer cada ferramenta � importante no mundo open source devido ao amadurecimento r�pido (ou �s vezes demorado) do c�digo. O que h� em comum nas ferramentas que ser�o aqui apresentadas � que s�o rec�m nascidas, mas muito poderosas.

PgCluster

O primeiro a analisarmos rapidamente � o PgCluster. O grande diferencial deste sistema � a replicaç�o baseada na query, ou seja, o cliente executa uma instruç�o SQL e esta instruç�o pode ser executada nos demais clusters. Abaixo alguns pontos sobre o produto:

�Replicaç�o s�ncrona incluindo balanceamento de carga;

�Pode ser encontrado em http://pgcluster.projects.postgresql.org;

�N�o se tem conhecimento da estabilidade e desempenho.

PgPool

PgPool � um connection pool server para PostgreSQL, ou seja, � uma camada entre o cliente (front end) e o servidor (back end). Assemelha-se com o PgCluster por�m, como Pool, faz caches das conex�es com o PostgreSQL reduzindo o overhead e aliviando assim o banco. � poss�vel tamb�m us�-lo para prover alta disponibilidade j� que o pgpool foi projetado n�o somente para fazer cache, mas tamb�m replicaç�o. Veja abaixo algumas de suas poss�veis implementaç�es:

�Implementa Pool de conex�o sem alterar a aplicaç�o cliente;

�Balanceamento de carga;

�Cache de conex�es;

�Replicaç�o s�ncrona;

�Transfere as conex�es para um segundo servidor caso o primeiro caia;

�Pode ser encontrado em http://pgpool.projects.postgresql.org/.

pgReplicator

pgReplicator � uma ferramenta de replicaç�o ass�ncrona. O pgReplicator � baseado na linguagem procedural interpretada TCL com o PostgreSQL como cont�iner. Como caracter�sticas do produto, posso citar:

��Armazena e encaminha� � replicaç�o ass�ncrona (via script.sql);

�Projeto parado;" [...] continue lendo...

Introdu��o a Replica��o e alta disponibilidade no PostgreSQL

Artigo da Revista SQL Magazine - Edição 24.

Artigos relacionados