Artigo SQL Magazine 62 - Fragmenta��o no SQL Server 2005

Esse artigo faz parte da revista�SQL Magazine edi��o 62. Clique aqui para ler todos os artigos desta edi��o

candidato se inscreve para o vestibular da FATEC Sorocaba (usando o mesmo site da FATEC Indaiatuba), os dados ser�o armazenados no servidor localizado na cidade de Sorocaba e assim por diante.

Para esse sistema, simulamos em laborat�rio sete unidades da FATEC, ou seja, o sistema reconhece sete inst�ncias diferentes do SGBD (SQL Server 2005) como se estivessem dispersos por diversas cidades do estado de S�o Paulo. O artigo est� dividido em duas partes: a primeira apresenta alguns conceitos de distribui��o e os scripts usados na elabora��o do projeto; a segunda apresenta um roteiro para a elabora��o de um software, codificado em Java, que acessa o sistema distribu�do. A Figura 1 ilustra o projeto de distribui��o entre as inst�ncias do SQL Server.

Em nosso projeto, a distribui��o dos dados ser� realizada por meio da fragmenta��o. A fragmenta��o � um processo de criar fragmentos (peda�os) de uma tabela. Em outras palavras, uma mesma tabela � dividida em fragmentos e cada fragmento pode ser armazenado em um local diferente. Na verdade, a mesma tabela � criada nas diferentes inst�ncias do SGBD e cada tabela mant�m uma parte dos dados, ou seja, a uni�o dos dados presentes em cada uma das inst�ncias ir� compor o conjunto total dos dados. Para o SGBD, n�o existe diferen�a entre uma tabela e um fragmento, j� que o fragmento � a pr�pria tabela. Como veremos ao longo deste artigo, a fragmenta��o utilizada nesse artigo foi a horizontal, ou seja, cada fragmento representa um conjunto de registros da tabela.

�

Figura 1. Distribui��o entre as inst�ncias do SQL Server

�

Defini��o de Banco de Dados Distribu�dos

Banco de Dados Distribu�dos (BDD) se refere a uma cole��o de v�rios bancos de dados logicamente inter-relacionados e distribu�dos por uma rede de computadores. Existem dois tipos de BDD, os homog�neos e os heterog�neos. Os homog�neos s�o compostos por apenas um tipo de Sistema Gerenciador de Banco de Dados (SGBD), por exemplo, v�rios servidores SQL Server. Esse artigo apresenta um exemplo de sistema distribu�do homog�neo, pois no caso todas as inst�ncias ser�o do SQL Server 2005. Os heterog�neos s�o compostos por mais de um tipo de SGBD, ou seja, em um mesmo ambiente distribu�do pelo menos um dos SGBDs � diferente em rela��o aos demais. Os SGBDs que suportam distribui��o s�o conhecidos como SGBDD (Sistema Gerenciador de Banco de Dados Distribu�dos). O pr�ximo t�pico apresenta algumas caracter�sticas dos SGBDDs.

�

Principais caracter�sticas de um SGBDD

De acordo com Date (2004), um SGBDD deve conter diversas caracter�sticas para ser considerado como tal. Os itens seguintes abordam essas caracter�sticas de forma resumida.

1.�� Autonomia local: cada n� participante de um sistema distribu�do (cada SGBDD) deve ser independente dos outros n�s e prover mecanismos de seguran�a, bloqueio, acesso, integridade e recupera��o ap�s falha;

2.�� Independ�ncia de um n� central: um SGBDD n�o deve depender de um n� central. Se a depend�ncia ocorrer, o sistema fica menos robusto, j� que possui um �nico ponto de falha. Isso afetaria todos os outros n�s. Um n� central pode acarretar perda de desempenho do sistema, j� que tende a ficar muito �carregado�;

3.�� Opera��o cont�nua: um sistema distribu�do n�o deve necessitar desativa��o. As opera��es de backup e a recupera��o devem ter suporte on-line. As opera��es devem ser r�pidas o bastante para n�o afetarem o funcionamento do sistema (backup incremental, por exemplo);

4.�� Transpar�ncia e independ�ncia de localidade: os usu�rios do sistema n�o precisam ter ci�ncia do local onde os dados est�o armazenados. Para o usu�rio, os dados devem ser vistos como se fossem locais.

5.�� Independ�ncia de fragmenta��o: as tabelas do sistema de banco de dados distribu�do podem estar fragmentadas e localizadas fisicamente em diferentes n�s, de forma transparente para o usu�rio. Usu�rios e aplica��es n�o devem saber que as tabelas est�o armazenadas em n� diferente do n� onde s�o feitas as opera��es. A fragmenta��o pode ser horizontal (fragmenta��o em linhas) ou vertical (fragmenta��o em colunas). Maiores detalhes ser�o apresentados na continuidade deste artigo;

6.�� Independ�ncia de replica��o: dados replicados em v�rios n�s da rede, de forma transparente. Assim como nas regras de independ�ncia de localiza��o e fragmenta��o, a independ�ncia de replica��o � projetada para livrar os usu�rios de preocupa��es relacionados com o local onde os dados est�o armazenados. No caso da replica��o, os usu�rios e as aplica��es n�o precisam saber que r�plicas de dados s�o mantidas e sincronizadas automaticamente pelo SGBDD;

7.�� Processamento de consultas distribu�do: o desempenho de uma consulta deve ser independente do local onde a mesma � executada. O SGBDD deve possuir um otimizador que possa selecionar n�o apenas o melhor caminho para o acesso a um determinado n� da rede, mas tamb�m otimizar o desempenho de uma consulta distribu�da, levando em conta a localiza��o dos dados, utiliza��o de CPU e I/O e ainda o tr�fego da rede;

8.�� Gerenciamento de transa��es distribu�das: Em um sistema distribu�do, uma �nica transa��o pode envolver a execu��o de c�digo de v�rios sites. A transa��o, nesse caso, consiste em v�rios agentes. O sistema precisa saber quando dois agentes s�o partes da mesma transa��o; esses agentes n�o devem ter impasses entre eles (deadlock).

9.�� Independ�ncia de hardware: � uma caracter�stica desej�vel que um SGBDD n�o dependa de um determinado hardware, nem deve ser limitado a uma determinada plataforma;

10.� Independ�ncia de sistema operacional: da mesma forma que o item anterior, � desej�vel que um SGBDD n�o dependa de um sistema operacional em especial;

11.� Independ�ncia de rede: um SGBDD deve ser projetado para executar independente do protocolo de comunica��o e da topologia de rede;

12.� Independ�ncia de SGBD: um SGBDD ideal deve possuir capacidades para se comunicar com outros sistemas de banco de dados executando em n�s diferentes, ainda que heterog�neos.

�

Vantagens dos Bancos de Dados Distribu�dos

Quais motivos levam uma empresa a utilizar um BDD? Para responder essa pergunta, vamos apresentar algumas caracter�sticas que justificam a utiliza��o da distribui��o dos dados.

Primeiramente, as empresas s�o distribu�das geograficamente (matriz, filiais etc). Da mesma forma, um banco de dados pode ser distribu�do fisicamente em v�rias inst�ncias, onde cada qual armazena os dados que dizem respeito a si. Em nosso caso, cada unidade da FATEC possui candidatos ao vestibular para uma determinada localidade (Indaiatuba, S�o Paulo, etc.). Sendo assim, � mais sensato armazenar os candidatos no servidor local de cada unidade da FATEC. Dessa forma, o BD passa a refletir a estrutura f�sica da institui��o.

Al�m disso, atrav�s do uso de SGBDDs � poss�vel acessar os dados localizados em sites pr�ximos aos usu�rios e, ao mesmo tempo, compartilhar dados armazenados em outros sites. Em organiza��es descentralizadas, o gerenciamento dos dados pode ser delegado aos administradores locais, permitindo maior autonomia e responsabilidade.

Considerando-se a replica��o de dados, se houver problemas com a perda de dados de uma localidade, � poss�vel recuperar esses dados a partir de outras localidades. Em nosso projeto, n�o estaremos considerando a utiliza��o da replica��o de dados.

Por fim, ao utilizar um SGBDD, os esfor�os e custos associados ao aumento no n�mero de sites em uma rede podem ser menores quando comparados com os custos associados � expans�o de um banco de dados centralizado. Provavelmente, a expans�o do banco centralizado necessitaria de atualiza��o do hardware e incrementaria os custos do sistema como um todo. A facilidade de inser��o de um novo n� (nova inst�ncia) no sistema distribu�do aumenta a potencialidade de expans�o do sistema. De forma semelhante, em organiza��es geograficamente distribu�das e muito distantes entre si, a distribui��o de dados pode apresentar benef�cios, j� que manter dados centralizados pode envolver um custo muito alto. Na maioria das vezes, os dados distribu�dos podem ser compartilhados por v�rios locais a um custo bem inferior.

�

...

Fim do trecho gratuito • continue abaixo

CONTE�DO EXCLUSIVO

Desbloqueie toda a DevMedia

+2000 artigos e v�deos

+40 trilhas sobre Front-end, Back-end, IA e muito mais

+5000 exerc�cios pr�ticos

Mentorias ao vivo individuais

at� 50% OFF

A partir de

R$ 69 /m�s
Assinar agora

// 25 ANOS FORMANDO PROGRAMADORES

APRENDA A

PROGRAMAR DE VERDADE

Um caminho claro do zero ao avan�ado, com pr�tica de verdade.

Voc� constr�i projetos reais desde o come�o e sai sabendo programar sozinho, sem copiar c�digo de professor.

Forma��es completas

+40 Projetos

+5000 exerc�cios

+40 Tecnologias

Mentorias individuais

Suporte com IA

Comunidade de alunos

QUERO COME�AR AGORA

Confira outros conte�dos:

Supabase: banco de dados como servi�o...

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

Por S�rgio Em 2009

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Compartilhe esse conte�do com um amigo!
Fa�a login para ganhar recompensas.
Copie o link e envie para seus amigos
Ou

Artigo SQL Magazine 62 - Fragmenta��o no SQL Server 2005

Este artigo apresenta um pequeno projeto de distribui��o de dados envolvendo as unidades de uma institui��o de ensino.

Desbloqueie toda a DevMedia

Confira outros conte�dos: