Artigo da SQL Magazine 28 - D�vidas freq�entes sobre bancos de dados

Clique aqui para ler esse�artigo em PDF.

�

Clique aqui para ler todos os artigos desta edi��o

�

D�vidas frequentes sobre�Banco de Dados�

Cesar Blumm e Miguel Rodrigues Fornari

�

SGBDs s�o utilizados h� mais de trinta anos por diversas empresas. Ao longo deste tempo de uso, diversas� d�vidas tornaram-se comuns, por exemplo, h� diferen�a na utiliza��o de VARCHAR e CHAR? Uma delas ser� mais r�pida? De t�o comuns, � f�cil encontrar em manuais e livros da �rea as respostas. Mas, ser� que estas respostas j� n�o est�o ultrapassadas frente ao avan�o de software e hardware?

Neste artigo n�s procuramos verificar se algumas respostas, frente � evolu��o da tecnologia, ainda s�o verdadeiras, ou se devem ser alteradas. As perguntas analisadas foram:

�� O que utilizar: VARCHAR ou CHAR?

�� A exist�ncia de �ndices ajuda na execu��o de um ORDER BY?

�� Deve-se desligar os �ndices durante cargas de dados em uma tabela?

�� A ordem das tabelas na cl�usula FROM altera o tempo de resposta?

�� interessante manter as tabelas ordenadas no disco?

�

Para responder a cada uma destas cinco perguntas, um conjunto de testes foi realizado, medindo o tempo de resposta em tr�s diferentes SGBDs: Oracle 10g (e �s vezes 9i), MS SQL Server 2000 e Firebird 1.5.2. Todas as opera��es foram realizadas no mesmo servidor, ativando apenas um dos SGBDs por vez para evitar interfer�ncias. O servidor sempre esteve dedicado a realizar uma �nica consulta, sem sofrer interfer�ncia de usu�rios concorrentes. Os SGBDs estavam em sua configura��o default, exceto quando registrado o contr�rio.

Etapas no processamento de uma consulta

Antes de apresentarmos nossas respostas �s perguntas, � importante explicar, mesmo que brevemente, como funciona o processamento de um consulta. A Figura 1 ilustra o processo.

�

Figura 1. Etapas no processamento de uma consulta.

�

O usu�rio submete uma consulta em SQL. A primeira etapa, realizada pelo analisador, verifica a corre��o da consulta e a transforma em uma �rvore de opera��es b�sicas, mantida internamente em uma estrutura de dados espec�fica. Se houver erros, o processo � interrompido e o erro retornado ao usu�rio. Na segunda etapa, o otimizador de consultas escolhe a melhor seq��ncia para realizar as opera��es b�sicas e, entre os algoritmos poss�veis para uma determinada opera��o, o melhor deles. A ordem de execu��o das opera��es e o algoritmo selecionado para cada uma delas comp�em o plano de consulta que, enfim, � realizado pelo engine do SGBD. Finalmente, a resposta da consulta pode ser enviada ao usu�rio.

Neste processo, o otimizador desempenha o papel central. H� dois tipos de otimiza��es:

�� otimiza��o baseada em regras heur�sticas. Estas regras est�o incorporadas ao Oracle. Em geral, elas produzem bons resultados, mas n�o h� comprova��o para garantir sua corre��o em todas as consultas;

�� otimiza��o baseada em estat�sticas. Nesta op��o, o otimizador utiliza algumas f�rmulas para calcular o custo (tempo de processamento + tempo de acesso aos dados em disco) de v�rias op��es poss�veis, e escolher a op��o que apresentar o menor custo estimado. Os dados estat�sticos, como n�mero de linhas em cada tabela e n�mero de diferentes valores de cada atributo s�o mantidos no dicion�rio de dados do SGBD.

�

Alguns SGBDs utilizam apenas um dos m�todos, outros permitem que o DBA escolha o m�todo de otimiza��o que apresentar melhores resultados.

Tendo entendido como pode ser realizado o processamento de uma consulta, vamos agora analisar as perguntas formuladas no in�cio desta mat�ria.

Pergunta 1: O que utilizar, VARCHAR ou CHAR?

A resposta mais comum afirma que atributos VARCHAR reduzem o espa�o de armazenamento, por�m atributos CHAR reduzem o tempo de resposta.

Para obter a resposta, foram criadas tabelas com diferentes tipos de atributos e n�mero de registros. A estrutura b�sica das tabelas pode ser vista na Tabela 1. H� uma vers�o com todos os campos alfanum�ricos mapeados para CHAR, e outra com eles mapeados para VARCHAR. A cardinalidade das tabelas variou entre 50.000 (tabela pequena), 300.000 (tabela m�dia) e 900.000 (tabela grande) registros.

�

Coluna	Tipo
Chave	Alfanum�rico(06)
CampoCheio	Alfanum�rico(40)
CampoVazio	Alfanum�rico(40)
CampoMeio	Alfanum�rico(40)
CampoData	Data
CampoInteiro	Inteiro
CampoDecimal	Decimal(9,2)

Tabela 1. Defini��o das tabelas VARCHAR e CHAR.

�

A partir dos dados armazenados, foram realizadas diversas e repetidas vezes consultas por campos de �ndice, por campos comuns, utilizando a cl�usula LIKE do SQL e por intervalo de registros, sempre aferindo os tempos para cada consulta realizada. Ap�s as consultas, foram exclu�das todas as linhas com o comando DELETE do SQL.

A primeira parte da resposta a esta pergunta afirma que tabelas com campo VARCHAR devem ocupar menos espa�o em disco que as tabelas com campo CHAR.

Por�m, no Firebird, � interessante notar que as tabelas CHAR est�o ocupando menos espa�o na �rea de dados do que as tabelas VARCHAR. Ou seja, a resposta esta errada! J� na �rea de �ndices, as duas ocupam o mesmo espa�o.

�

Resultados obtidos

A Tabela 2 mostra o espa�o ocupado em disco, em Kb, para manter as duas vers�es da tabela, no Firebird.� � interessante notar que as tabelas CHAR est�o ocupando menos espa�o na �rea de dados do que as tabelas VARCHAR.

�

Descri��o

VARCHAR:

Tamanho em Kb

CHAR:

Tamanho em Kb

VARIA��O:

�rea de Dados

Tabela pequena

6.152

6.352

3,25%

Tabela m�dia

...

Quer ler esse conteúdo completo? Tenha acesso completo

Confira outros conte�dos:

Por Devmedia Em 2007

Artigo da SQL Magazine 28 - D�vidas freq�entes sobre bancos de dados

Artigo publicado na Revista SQL Magazine - Edi��o 28.

Confira outros conte�dos: