Por que eu devo ler este artigo:O objetivo deste artigo é apresentar a ferramenta PgPool-II, utilizada para a criação de sistemas de banco de dados distribuído no SGBD PostgreSQL através da instalação e configuração de um ambiente de redundância e de alta disponibilidade.

Um sistema de banco de dados distribuído é capaz de oferecer diversas vantagens onde um grande volume de dados e processamento é utilizado, aumentando o desempenho das aplicações e oferecendo um ambiente descentralizado e de alta disponibilidade.

Em um cenário global onde o volume de dados vem sendo cada vez maior em tamanho e importância, torna-se essencial que o banco de dados consiga oferecer agilidade e segurança para o acesso dos dados.

Um sistema de banco de dados distribuído pode ser entendido como um banco de dados virtual, composto por diversos bancos de dados “reais” interligados fisicamente, através de vários meios como redes de alta velocidade, redes sem fio ou linhas telefônicas.

Normalmente, o usuário deste sistema não sabe onde os dados estão localizados fisicamente, caracterizando um sistema altamente transparente.

Entretanto, os computadores em um sistema de banco dados distribuídos não compartilham componentes físicos, como memória principal ou discos de armazenamento, podendo variar em tamanho e função, diferentemente de um sistema paralelo. A Figura 1 representa um sistema distribuído interligado por uma rede de comunicação.

Figura 1. Representação de um sistema distribuído

Neste sistema, o banco de dados é armazenado em diversos computadores, que são denominados como “clusters” (nós). Cada cluster possui seu próprio hardware e não compartilham nenhum componente físico.

Diferente de um sistema paralelo, os clusters podem variar em tamanho e função. Uma das vantagens em utilizar um sistema distribuído em clusters é sua alta disponibilidade, uma vez que no desativamento de um cluster, seja por problemas técnicos ou qualquer outro motivo, um outro cluster pode tomar para si as requisições vindas pelas aplicações.

Um sistema de banco de dados distribuído pode ainda ser classificado de duas formas: sistemas Homogêneos, onde todos os clusters do sistema rodam o mesmo SGBD, conhecendo um ao outro e facilitando o processamento das transações; e, Sistemas Heterogêneos, onde cada cluster roda um SGBD diferente, muitas vezes limitando e dificultando o processo de manipulação dos dados, além de aumentar sua complexidade.

Formas de armazenamento de dados

Existem diversas formas com que um banco de dados distribuído pode armazenar os dados, sendo as principais:

· Replicação: onde o sistema mantém réplicas idênticas dos dados entre seus diversos clusters, assegurando que todos os servidores tenham o mesmo conteúdo durante todo o tempo.

Esta replicação pode ocorrer de forma síncrona ou assíncrona. No caso da primeira, o conteúdo é replicado imediatamente após uma transação, enquanto que na segunda, o servidor que está recebendo a transação pode esperar por todo seu processamento para depois enviar a modificação aos demais servidores.

De modo geral, a replicação dos dados também fornece maior desempenho nas operações de leitura, porém, as operações de atualização consomem maior recurso, pois há a necessidade de atual ...

Quer ler esse conteúdo completo? Tenha acesso completo