Replica��o no PostgreSQL

Esse artigo faz parte da revista SQL Magazine edi��o 60. Clique aqui para ler todos os artigos desta edi��o

-se cada vez mais necess�ria a utiliza��o de t�cnicas de replica��o de dados. Tais t�cnicas v�o desde uma simples c�pia de um servidor a outro, at� uma estrutura que prov� capacidade de alta disponibilidade, recupera��o de falhas, balanceamento de carga e etc. Cada uma com sua particularidade de utiliza��o e gerenciamento, com pontos negativos e positivos.

Este artigo demonstrar� algumas t�cnicas de replica��o de bases de dados dispon�veis no PostgreSQL. Para tanto, ser�o feitas apresenta��es r�pidas de cada m�todo, focando os pr�s e contras de cada utiliza��o. Ser�o mostradas as t�cnicas de replica��o com PGCluster, Slony, replica��o dos arquivos de transa��es (log shipping), Sequoia e PGPool.

PGCluster

O PGCluster � uma ferramenta de replica��o do PostgreSQL que permite a montagem de um sistema de replica��o s�ncrono multi-master, onde existe uma replica��o em tempo real, com a utiliza��o de v�rios servidores prim�rios. Ele pode ser composto por tr�s tipos de servidores: o de balanceamento de carga, o de armazenamento e o de replica��o (ver Figura 1).

Pode haver mais de um servidor respons�vel pelo balanceamento de carga, recebendo as consultas e as encaminhando para os n�s de armazenamento com menor carga. O fator de carga de um n� � calculado pelo n�mero de sess�es ativas (conex�es feitas pelo sistema ou diretamente por usu�rios que est�o realizando alguma tarefa). Ele tamb�m tem a fun��o de verificar se h� problemas com o n� de armazenamento durante esta comunica��o, separando-o se houver falhas.

O servidor de armazenamento, podendo haver mais de um, faz parte do agrupamento do banco de dados (chamado cluster). � o servidor que mant�m o back-end do PostgreSQL, onde os dados podem ser armazenados (caso n�o se utilize uma unidade externa de armazenamento como um storage) e processados.

O servidor de replica��o, podendo tamb�m haver mais de um, cuida da sincronia dos dados entre os diversos hosts de armazenamento, e quando o servidor de replica��o principal falha, outro assume o seu lugar.

A replica��o pode ser feita de dois modos: modo normal e modo confi�vel. No modo normal, uma resposta � enviada ao usu�rio assim que a atualiza��o for executada no n� de armazenamento que a recebe. No modo confi�vel, a resposta s� � enviada ap�s a execu��o do comando de atualiza��o ter sido realizada em todos os n�s de armazenamento.

O servidor de replica��o tamb�m verifica problemas com o n� de armazenamento durante a comunica��o. Se um problema for detectado, o servidor de replica��o separa o n� para posterior replica��o e uma entrada no arquivo de log � criada. Quando um n� � recolocado ou adicionado ao agrupamento, o servidor de replica��o cuida da sincroniza��o dos dados.

Figura 1. Estrutura do PGCluster para balanceamento de carga e replica��o

O PGCluster s� pode ser executado em um ambiente Linux, pois o engine � derivado de uma modifica��o no c�digo fonte do PostgreSQL e compilado para este ambiente operacional. Al�m dessa restri��o, existem outras que podem ser mencionadas, como o fato dos large objects (tipos de dados que podem guardar objetos muito grandes) que para serem replicados, devem ser colocados em um diret�rio que possa ser acessado por todos os servidores de armazenamento do cluster. O PGCluster tamb�m n�o consegue restaurar um banco de dados quando o mesmo utiliza tablespaces (organiza��o l�gica do banco de dados, que especifica um local f�sico no sistema de arquivo, onde os objetos ser�o armazenados).

Testes de performance foram divulgados comparando-se o PostgreSQL com o PGCluster configurado e o PostgreSQL isolado. Com a utiliza��o do PGCluster, foi observado que, � medida que o n�mero de atualiza��es aumentava, sendo executadas paralelamente com as consultas, havia uma queda de performance devido ao fato da atualiza��o requerer um bloqueio para processar as atualiza��es que s�o replicadas. Esta sobrecarga anulava o efeito da carga de processamento distribu�da.

Como alternativa �s limita��es do PGCluster foi desenvolvido o PGCluster II, que � uma tentativa de reescrever o mesmo, usando um modelo de mem�ria compartilhada. Este projeto foi criado com o objetivo principal de fazer as escritas menos custosas, sem sacrificar a alta disponibilidade nem a performance da leitura de dados, focando um ambiente de sistemas web. ...

Quer ler esse conteúdo completo? Tenha acesso completo

Compartilhe esse conte�do com um amigo!
Fa�a login para ganhar recompensas.
Copie o link e envie para seus amigos
Ou

Replica��o no PostgreSQL

Artigo publicado Revista SQL Magazine 60.

Confira outros conte�dos: