artigo SQL Magazine 30 - Char x Varchar

Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

Aten��o: por essa edi��o ser muito antiga n�o h� arquivo PDF para download.
Os artigos dessa edi��o est�o dispon�veis somente atrav�s do formato HTML.

Imagem

Clique aqui para ler todos os artigos desta edi��o

Char x Varchar:

estendendo a discuss�o

�

Na edi��o 28, Cesar Blumm e Miguel Fornari levantaram cinco interessantes d�vidas freq�entes sobre bancos de dados. A primeira delas, uma compara��o entre os tipos de dados Char e Varchar, deixou claro que a escolha do segundo seria em alguns casos vantajosa em rela��o ao primeiro. Mostraremos nesta mat�ria algumas situa��es em que o uso de Varchar � mais vantajoso.

Espera-se que o leitor j� tenha alguma viv�ncia em SQL Server, conhecendo suas principais ferramentas tais como Query Analyzer ou Enterprise Manager, al�m de, claro, ter lido a mat�ria de Cesar e Miguel. Acreditamos firmemente que resultados semelhantes aos obtidos nos testes aqui realizados com SQL Server seriam tamb�m alcan�ados em Oracle, PostgreSQL, ou qualquer outro SGBDR.

�

Fundamentos

�

Inicialmente, vale frisar que independente do fato da escolha do tipo de tamanho vari�vel geralmente apresentar melhores resultados do que o tipo de tamanho fixo, existem situa��es em que n�o h� d�vidas quanto � melhor escolha. Por exemplo, imagine uma tabela de funcion�rios contendo um campo denominado UF (Unidade da Federa��o). Ora, se j� sabemos de antem�o que todas as linhas ter�o neste campo dois e apenas dois caracteres, porque introduzir o �nus do tamanho vari�vel? Vale frisar que, para o SGBDR, o fato de um campo ter tamanho vari�vel ao inv�s de fixo incorre em mais um trabalho, j� que se deve registrar de alguma forma o tamanho corrente da cadeia de caracteres de tamanho vari�vel.

Isso vale para qualquer campo de caracteres, cujo preenchimento pleno ou n�o, seja conhecido previamente. Tenha o campo um, dez ou oito mil caracteres, caso soub�ssemos que estar� completamente preenchido, vale a pena utilizar o tamanho fixo.

Outro aspecto n�o comentado no artigo de Blumm e Fornari contempla a fragmenta��o dos �ndices envolvendo as cadeias de caracteres. A seguir, vamos provar que, dependendo do n�vel de atualiza��es em uma tabela, o n�vel de fragmenta��o dos �ndices associados prejudica tanto os tempos de resposta quanto os custos das consultas sobre a tabela.

Basicamente, montamos o seguinte experimento:

1. Criam-se duas tabelas, FIXA e VARIAVEL, ambas contendo grandes cadeias, por�m uma utilizando o campo CHAR e outra o VARCHAR;

2. Realizam-se cargas massivas que provoquem a ocupa��o de um d�cimo de cada string;

3. Para viabilizar consultas, constroem-se �ndices e verificam- se custo e tempo de resposta de uma consulta envolvendo as cadeias. Como era de se esperar, e em conformidade com os testes realizados por Blumm e Fornari, o tipo vari�vel vence amplamente, j� que h� muito menos p�ginas (ler Nota 1) a serem varridas;

4. Nova carga acontece, agora aumentando o n�vel de preenchimento das p�ginas de 10 para 90%! E, como imagin�vamos, a consulta sobre o campo vari�vel perde da consulta sobre o campo fixo.

�

Nota 1. P�gina

Consiste na menor unidade de transfer�ncia entre disco e mem�ria.

Possui tamanho fixo, 8Kb, e nenhuma linha pode extrapolar seus

limites.

�

Carga inicial

�

Ativando o Query Analyzer e abrindo-se uma conex�o, observe os comandos presentes na Listagem 1 respons�veis pela cria��o da base.

�

Listagem 1. Comandos digitados no Query Analyzer para a cria��o da base de dados.

�

create database teste on primary

(name = �teste_dat�,

�� filename = �c:\teste.mdf�, size = 12 GB,

�� maxsize = 50 GB, filegrowth = 100 MB)

log on

(name = �teste_log�,

�� filename = �c:\teste.ldf�,

�� size = 100 MB, filegrowth = 10 MB)

alter database teste set recovery simple

�

Perceba que j� criamos uma grande base (12 GB), suficiente para comportar as tabelas plenamente preenchidas. Este pr�-dimensionamento evitar� que, durante os processos de carga, existam expans�es do arquivo f�sico (TESTE.MDF), que causem poss�veis fragmenta��es em disco. Vale tamb�m frisar a escolha pelo Modelo de Recupera��o (Recovery Model) Simple. Isto faz com que o registro de transa��es (Transaction Log) n�o precise ser copiado de tempos em tempos, mantendo o tamanho do arquivo f�sico sempre constante, neste caso, em 100 MB.

A Listagem 2 exibe a cria��o das tabelas, uma contendo a cadeia de caracteres com tamanho vari�vel e outra fixo.

�

Listagem 2. Comandos digitados no Query Analyzer para a cria��o das tabelas.

�

use teste

create table variavel (id integer identity not null,

variavel varchar (200) not null)

�

create table fixa (id integer identity not null, fixo

char (200) not null)

�

As Listagens 3 e 4 cont�m comandos para a primeira carga nas tabelas e cria��o de respectivos �ndices. Como bem lembrado no artigo de Blumm e Fornari, os �ndices devem ser criados depois das cargas. Assumimos a presen�a da tabela products na base Northwind. Perceba como garantimos o preenchimento de um d�cimo de cada linha concatenando ao contador os 14 primeiros caracteres do nome do produto.

�

Listagem 3. Carga da tabela VARIAVEL.

�

set nocount on

declare @a int

set @a = 1

while @a <= 100000

�� begin

�� insert variavel (variavel)

...

Quer ler esse conteúdo completo? Tenha acesso completo