artigo SQL Magazine 9 - Estatísticas de Distribuição de Dados no SQL Server

Aten��o: por essa edi��o ser muito antiga n�o h� arquivo PDF para download.
Os artigos dessa edi��o est�o dispon�veis somente atrav�s do formato HTML.

Clique aqui para ler todos os artigos desta edi��o�

Estat�sticas de Distribui��o de Dados no SQL Server

�

As estat�sticas de distribui��o de dados representam o cora��o do otimizador de consultas SQL de todo banco de dados. Estat�sticas desatualizadas ou mesmo a falta de estat�sticas adequadas no momento da execu��o de uma query podem resultar na escolha de planos de execu��o ineficientes, causando perdas de desempenho.

Neste artigo, apresentaremos algumas estat�sticas utilizadas pelo SQL Server 2000. Aprenderemos a ler as estat�sticas de um �ndice e faremos alguns exemplos pr�ticos para demonstrar sua import�ncia. Ser� explicado tamb�m como o otimizador de comandos faz uso de estat�sticas para escolher o melhor plano de execu��o de uma consulta.

�

Decifrando estat�sticas

�

As estat�sticas existem para que o otimizador de queries possa �prever� o n�mero de linhas afetadas pelo comando sem que ele precise ser executado. Atrav�s de simula��es envolvendo os diversos �ndices da tabela, o otimizador pode escolher aquele que apresenta melhor custo-benef�cio e com isso, movimentar um n�mero menor de registros para processar a query. As estat�sticas servem tamb�m para determinar o melhor algoritmo de join (nested loop, merge ou hash) para resolver a query.

Esses c�lculos estat�sticos envolvem duas unidades b�sicas de medidas: seletividade e densidade. Seletividade consiste em uma propriedade relativa ao n�mero de linhas identificadas por um valor chave. Por exemplo, as primary-keys s�o altamente seletivas, pois, a partir da(s) coluna(s) que comp�em sua chave, � poss�vel identificar um (e somente um) registro. A densidade � o inverso de seletividade. Ela mede o �ndice de duplicidades existentes num �ndice. �ndices n�o exclusivos, com muitas chaves duplicadas, possuem densidade alta e seletividade baixa. A Listagem 1 nos mostra um exemplo pr�tico do c�lculo desses �ndices para a tabela Orders, considerando a coluna CustomerId.

�

select� Nro_Linhas_Orders�� = count(*),

�� CustomerId_Distintos�� = count(distinct CustomerId),

�� Seletividade_CustomerId � = count(distinct CustomerId) / cast(count(*) as dec(5,2)),

�� Densidade_CustomerId�� = 1 / cast(count(distinct CustomerId) as dec(5,2))

from Orders

�

-------------------------------------------------------------------------------------------------

Nro_Linhas_Orders�� Clientes_Distintos�� Seletividade_CustomerId�� Densidade_CustomerId

-------------------------------------------------------------------------------------------------

816�� 89�� .109068�� .011235

Listagem 1: C�lculo da densidade e seletividade para a tabela Orders, coluna CustomerId.

�

Aplicando os conceitos de seletividade e densidade no resultado da Listagem 1, percebemos o seguinte:

�� A seletividade da coluna CustomerId � baixa ( ela identifica apenas 11% de c�digos distintos na tabela Orders) (0.109068).

�� A densidade (ou �ndice de duplicidades) da coluna CustomerId � alta, e existem em m�dia 91 repeti��es (816 * 0.11235) para cada c�digo de cliente.

�

As estat�sticas de distribui��o de dados num �ndice podem ser visualizadas com o comando DBCC SHOW_STATISTICS. A Listagem 2 mostra o resultado desse comando sobre o �ndice composto ix_CustomerId_Orders (CustomerId,OrderDate), criado na tabela NorthWind.Orders.

�

Nota

As estat�sticas de distribui��o de um �ndice s�o armazenadas na coluna de data-type image em SysIndexes.StatBlob (tabela de sistema respons�vel por armazenar metadados dos �ndices e estat�sticas).

�

create index ix_CustomerId_OrderDate on Orders (CustomerId,OrderDate)

DBCC SHOW_STATISTICS (orders,IX_CustomerId_OrderDate)

�

----------------------------------------------------------------------------------------------------

Statistics for INDEX 'customerid'.

�

----------------------------------------------------------------------------------------------------

Updated�� Rows�� Rows Sampled�� Steps�� Density�� Average key length��

----------------------------------------------------------------------------------------------------

Aug 27 2003� 7:49PM�� 830�� 830�� 89�� 0.0�� 14.0

�

----------------------------------------------------------------------------------------------------

All density�� Average Length�� Columns��

----------------------------------------------------------------------------------------------------

1.1235955E-2�� 10.0�� CustomerID

1.2150669E-3�� 18.0�� CustomerID, OrderDate

1.2048193E-3�� 22.0�� CustomerID, OrderDate, OrderID

�

----------------------------------------------------------------------------------------------------

RANGE_HI_KEY�� RANGE_ROWS�� EQ_ROWS�� DISTINCT_RANGE_ROWS�� AVG_RANGE_ROWS��

----------------------------------------------------------------------------------------------------

ALFKI�� 0.0�� 6.0�� 0�� 0.0

ANATR�� 0.0�� 4.0�� 0�� 0.0

ANTON�� 0.0�� 7.0�� 0�� 0.0

AROUT�� 0.0�� 13.0�� 0�� 0.0

BERGS�� 0.0�� 18.0�� 0�� 0.0

BLAUS�� 0.0�� 7.0�� 0�� 0.0

BLONP�� 0.0�� 11.0�� 0�� 0.0

BOLID�� 0.0�� 3.0�� 0�� 0.0

BONAP�� 0.0�� 17.0�� 0�� 0.0

�..

��

Listagem 2: Execu��o do comando DBCC SHOW_STATISTICS sobre o �ndice ix_CustomerId_Orders

�

Analisemos agora o resultado desse comando:

�

1.�� A �ltima data de atualiza��o das estat�sticas desse �ndice foi 27 de agosto de 2003, �s 7:49 da noite (coluna Updated). Tabelas com alto �ndice de modifica��es precisam apresentar pouca defasagem de tempo nessa informa��o.

2.�� As colunas RANGE_HI_KEY e AVG_RANGE_ROWS informam detalhes sobre a distribui��o da PRIMEIRA COLUNA que comp�e o �ndice. Em nosso caso, para o �ndice ix_CustomerId_OrderDate� (CustomerId,OrderDate) ser� criado um histograma para a coluna CustomerId. Esse histograma nada mais � do que a contagem de ocorr�ncias dos c�digos de cliente (CustomerId) na tabela Orders. As duas linhas abaixo foram extra�das da Listagem 2 e alteradas para facilitar a compreens�o:

�

RANGE_HI_KEY�� RANGE_ROWS�� EQ_ROWS�� DISTINCT_RANGE_ROWS�� AVG_RANGE_ROWS��

----------------------------------------------------------------------------------------------------

1�� 0.0�� 15.0�� 0�� 0.0

75�� 50.0�� 8.0�� 10�� 5.0

...

�

2.1 - Existem 15 pedidos (EQ_ROWS) para CustomerId=1 e 8 pedidos para CustomerId=75;

2.2 - Existem 50 pedidos cujos c�digos de cliente CustomerId situam-se entre 1 e 75 (considerando-se c�digos repetidos);

2.3 - Dos 50 c�digos existentes no intervalo aberto ]1,75[, existem 10 c�digos distintos
�� (=DISTINCT_RANGE_ ROWS);

2.4 - Existe uma m�dia de 5 repeti��es para cada c�digo diferente situado no intervalo ]1,75[
�� (=AVG_RANGE_ ROWS).

�

3.�� O c�lculo de densidade � efetuado para a composi��o de todas as colunas que formam o �ndice. Em nosso caso, ele ser� reproduzido para as coluna CustomerId e CustomerId+OrderDate.

4.�� O c�lculo de densidade � representado pela f�rmula (1 / (somat�ria de valores distintos para a chave)). Considerando a coluna CustomerId, ter�amos o seguinte :

�

�� select� Densidade_CustomerId = 1 / cast(count(distinct CustomerId) as dec(5,2)) from Orders

�

Multiplicando a coluna ROWS da Listagem 1 pelos valores presentes em ALL DENSITY, temos uma id�ia clara da distribui��o das chaves do �ndice (ver Tabela 1).

�

Colunas do �ndice	Rows * All Density	Avalia��o
CustomerId	830 * 1.1235955E-2�� =� 9.32584	Para cada c�digo diferente de CustomerId, existe em m�dia 9 duplicidades
CustomerId +OrderDate	830 * 1.2150669E-3�� =� 1.00851��	Existe em m�dia somente uma ocorr�ncia na tabela Orders para a composi��o da chave CustomerId +OrderDate
CustomerId +OrderDate +OrderId	830 * 1.2048193E-3�� = 1	Existe somente uma ocorr�ncia na tabela Orders para a composi��o da chave CustomerId +OrderDate + OrderId

Tabela 1 � Calculo da Densidade.

�

No entanto, considerar separadamente as informa��es de densidade e o histograma j� n�o seriam suficientes para uma an�lise? Bem, o histograma � calculado somente para a primeira coluna do �ndice. Se voc� possuir um �ndice composto, o SQL Server 2000 n�o conseguiria uma medida precisa com base apenas no histograma. Se voc� fornecer a chave completa de um �ndice composto, o otimizador trabalhar� com as informa��es do histograma e de densidade e utilizar� aquela que apresentar o menor valor. Para predizer o n�mero de linhas afetadas pelo comando select * from Orders where CustomerId='BOTTM' and OrderDate='1996-12-20' e de posse das estat�sticas relacionadas na Listagem 2, temos duas op��es:

�

a.�� Para utilizar a informa��o de densidade, devemos multiplicar o n�mero de linhas da tabela pelo �ndice correspondente da coluna All Density para as colunas CustomerId,OrderDate (830*1.2150669E-3). O produto, neste caso igual a 1, representa o n�mero de linhas afetadas.

b.�� Utilizando o histograma, que registra a distribui��o da primeira coluna do �ndice (=CustomerId), obtemos a informa��o de que existem 14 linhas para RANGE_HI_KEY='BOTTM'.

�

Comparando as duas alternativas, (Densidade=1 ou Seletividade=14), optamos pela densidade, pelo fato de ela apresentar o menor valor (ver Figura 1).� Esse processo se repetir� para os �ndices presentes na tabela Orders para, ent�o, ser escolhido aquele que apresente melhor custo-benef�cio.

�� imagem �

Figura 1 - Estimativa de execu��o com base em informa��es da densidade do �ndice ix_CustomerId_OrderDate.

�

Como manter atualizadas as estat�sticas de um �ndice

�

Existem diversas maneiras de atualiza��o de estat�sticas (ver exemplos na Tabela 2):

�

1.�� auto-update statistics: op��o default para bancos de dados criados no SQL Server 2000. Pode ser acessada via comando sp_dbOption ou, no Enterprise Manager, na guia Properties...Options clicando-se com o bot�o direito no banco de dados em quest�o. Auto update statistics n�o imp�e atualiza��o on-line de estat�sticas, mas controla limites internos de altera��es que, quando atingidos, disparam as atualiza��es. � um m�todo bastante eficiente e sugiro que mantenham essa op��o ativa.

�

2.�� update statistics: atualiza estat�sticas relacionadas a uma tabela em particular. � interessante for�ar a atualiza��o de estat�sticas ap�s opera��es que envolvam a modifica��o de grande n�mero de registros.

�

3.�� sp_updatestats: essa stored procedure � um cursor que executa o comando update statistics para todas as tabelas de um banco.

�

Comando

Exemplo de utiliza��o

UPDATE STATISTICS table | view

�� [

�� index

�� | ( statistics_name [ ,...n ] )

�� ]

�� [�� WITH

�� [

�� [ FULLSCAN ]

�� | SAMPLE number { PERCENT | ROWS } ]

�� | RESAMPLE

�� ]

�� [ [ , ] [ ALL | COLUMNS | INDEX ]

�� [ [ , ] NORECOMPUTE ]

�� ]

[*] Para atualizar todas as estat�sticas vinculadas � tabela Orders:

update statistics Orders

�

[*]�Para atualizar as estat�sticas do �ndice ix_CustomeId_ OrderDate :

update statistics Orders (ix_CustomerId_OrderDate)

�

[*]�Para atualizar as estat�sticas do �ndice ix_CustomeId_ OrderDate, com base em uma amostra (=sample) de 50% da tabela Orders:

update statistics Orders (ix_CustomerId,OrderDate) with sample 50%

�

SP_UPDATESTATS [[@resample =] 'resample']

[*] Para atualizar todas as estat�sticas das tabelas pertencentes ao banco de dados NorthWind:

use NorthWind exec sp_updatestats

�

[*] Para atualizar todas as estat�sticas das tabelas pertencentes ao banco de dados NorthWind, adotando a mesma amostra utilizada na cria��o das estat�sticas:

use NorthWind exec sp_updatestats resample

�

SP_DBOPTION

�� [��[��@dbname��=��]��'database'��]
��[�,�[��@optname��=��]��'option_name'��]
��[ ,�[�� @optvalue ��= ] �'value'�� ]

[*] Para habilitar a atualiza��o autom�tica de estat�sticas no banco de dados NorthWind:

exec sp_dbOption �NorthWind�, �auto update statistics�, �true�

Tabela 2 - Exemplos de procedimentos para atualiza��o de estat�sticas

Cria��o autom�tica de estat�sticas

�

As estat�sticas s�o criadas para o primeiro elemento da chave de um �ndice. Considere um �ndice n�o-cluster de nome ix_pedido_sqlmag, formado pelas colunas (empresa,filial,nro_pedido) na tabela fict�cia� pedido_sqlmag. Al�m da estrutura f�sica, o metadata do �ndice ir� gerar e manter informa��es estat�sticas sobre a distribui��o das linhas de acordo com a chave do �ndice. Essas informa��es servir�o para o otimizador fazer proje��es e decidir a respeito da utiliza��o desse �ndice para resolver queries. Apenas para ilustrar, as informa��es estat�sticas arquivadas para o �ndice ix_pedido_sqlmag, mostrariam o seguinte:

Total de linhas da tabela : 10.000

Densidade m�dia das colunas que comp�e o �ndice:

Coluna	N�mero m�dio de linhas com a mesma informa��o
empresa	10.000 (= as linhas da tabela possuem a mesma empresa)
empesa +filial ��	�9.997� (= praticamente todas as linhas da tabela possuem a mesma empresa e filial)
Empresa +filial +nro_pedido�	�� 1 (= o conjunto empresa+filial+nro_pedido � �nico; n�o existem duas linhas�� com a mesma informa��o nessas tr�s colunas)

�

Fa�amos agora o papel do otimizador para resolver a query abaixo:

�

select� * from pedido_sqlmag where empresa=1 and filial=10��

�

Sabemos que o otimizador trabalha com proje��es. Para estimar o tempo de execu��o, ele se baseia em informa��es estat�sticas previamente armazenadas. Observando as estat�sticas do �ndice ix_pedido_sqlmag, ele percebe que o �ndice n�o � seletivo, pois todas as linhas da tabela pedido_sqlmag possuem empresa igual a �1. Dessa maneira, ele parte para o segundo elemento do �ndice (=filial). Nesse momento, existem duas op��es (ver tabela 3).

�

Auto-Create Statistics

est� habilitado?

Como o otimizador ir� proceder na escolha do plano de execu��o da query

N�O

O otimizador ir� analisar a densidade do conjunto empresa+filial. Como a densidade � alta � praticamente todas as colunas da tabela possuem a mesma empresa e filial � � certo que o otimizador n�o utilizar� o �ndice

.SIM

Como a informa��o de densidade do conjunto empresa+ filial n�o � seletiva, o otimizador ir� optar por gerar nesse momento as estat�sticas de distribui��o na forma de um histograma para a coluna filial. De posse das estat�sticas, o otimizador consegue identificar se filial igual a 10� possui alta seletividade no �ndice ix_pedido_sqlmag� e opta pela utiliza��o do �ndice para resolver a query.

Tabela 3

�

Com esse exemplo, conclu�mos que Auto-Create Statistics influencia a resolu��o de queries ao criar automaticamente estat�sticas necess�rias para o otimizador. Conclu�mos tamb�m que a situa��o ideal � manter a coluna MAIS SELETIVA no PRIMEIRO SEGMENTO DE �NDICES COMPOSTOS.

�

Ao deixar a cria��o autom�tica de estat�sticas a cargo do SQL Server 2000, ser�o criadas estat�sticas sempre que o otimizador se deparar com selects ineficientes, que forcem processos de �scan� (leituras sequenciais). Um ponto interessante: a estat�stica pura e simples nem sempre ajuda � saber que existem tr�s linhas sob uma determinada condi��o em um universo de 10.000 linhas existentes numa tabela n�o significa muita coisa SE N�O HOUVER UMA MANEIRA R�PIDA O BASTANTE PARA ACESSAR SOMENTE ESSAS TR�S LINHAS. Portanto, a situa��o ideal � que estat�sticas estejam amparadas por �ndices para que o acesso ao dado pesquisado seja realmente eficiente.

�

Para compreendermos como funciona a cria��o autom�tica de estat�sticas e sua import�ncia, faremos agora um exemplo pr�tico, executado no SQL Query Analyser.

�

1 � Inicialmente, desabilite a op��o auto create statistics do banco de dados NorthWind. � isso mesmo: para que possamos entender como funciona a cria��o autom�tica de estat�sticas, partiremos do caso oposto, ou seja, observaremos o que N�O acontece quando essa op��o est� desligada. O comando abaixo desligar� a cria��o autom�tica de estat�sticas:

�

exec sp_dbOption 'NorthWind','auto create statistics','FALSE'

�

2 - Crie e popule a tabela exemplo pedido_sqlmag (ver Listagem 3).

�

use NorthWind

set nocount on

�

create table pedido_sqlmag (

empresa�� smallint,

filial�� smallint,

nro_pedido int,

vlr_pedido decimal(10,2)�� )

�

declare @i smallint

set @i=0

while @i < 10000

begin

�� insert into pedido_sqlmag (empresa,filial,nro_pedido,� vlr_pedido)

�� values (�� 1�� ,�� 5� ,�� @i�� ,� (@i*1.5)� )

�� set @i=@i+1

end

Listagem 3

�

3 - Crie o �ndice abaixo na tabela pedido_sqlmag:

�

create unique index ix pedido_sqlmag on pedido_sqlmag (empresa,filial,nro_pedido)

�

4 - Confirme a exist�ncia de duas linhas na tabela de sistema SysIndexes. Uma para IndId=0 (indicando que pedido_sqlmag � uma heap) e outra entrada para IndId=2 (para o �ndice criado anteriormente) (ver Listagem 4).

�

select id_indice=indid,� nome_indice= left(name,50),� nro_linhas = rows� from sysindexes

where id=object_id('pedido_sqlmag')

----------------------------------------------------------------------------------------------------

�

id_indice�� nome_indice�� nro_linhas�

------------� -------------------------- --------------

0�� pedido_sqlmag�� 10000

2�� ix_pedido_sqlmag�� 10000

Listagem 4

�

Nota

Em algumas situa��es a coluna rows na tabela SysIndexes pode apresentar distor��es. Se isto ocorrer, o comando DBCC UpdateUsage ('NorthWind','pedido_sqlmag') ir� efetuar a corre��o.

�

5 - Confirme as estat�sticas criadas para o �ndice ix_pedido_sqlmag observando que o histograma � criado APENAS para a primeira coluna (nesse caso, empresa) que integra o �ndice (ver Listagem 5).

�

DBCC Show_Statistics ('pedido_sqlmag','ix_pedido_sqlmag')

----------------------------------------------------------------------------------------------------

Statistics for INDEX 'ix_pedido_sqlmag'.

�

Updated�� Rows�� Rows Sampled�� Steps� Density�� Average key length��

----------------------------------------------------------------------------------------------------

Sep� 3 2003� 7:33PM� 10000�� 10000�� 1�� 0.0�� 8.0

�

All density�� Average Length�� Columns��

----------------------------------------------------------------------------------------------------

1.0�� 2.0�� empresa

1.0�� 4.0�� empresa, filial

9.9999997E-5�� 8.0�� empresa, filial, nro_pedido

�

RANGE_HI_KEY�� RANGE_ROWS�� EQ_ROWS�� DISTINCT_RANGE_ROWS�� AVG_RANGE_ROWS��

----------------------------------------------------------------------------------------------------

1�� 0.0�� 10000.0�� 0�� 0.0

Listagem 5

�

6 � Agora, execute o select da Listagem 6, confirmando a sele��o do �ndice ix_pedido_sqlmag. O comando showplan_text faz com que o parser n�o execute a query, mas apenas mostre o plano de execu��o no formato texto.

�

set showplan_text on

select * from pedido_sqlmag where empresa=1 and filial=5 and nro_pedido=100

StmtText��

----------------------------------------------------------------------------------------------------

� |--Bookmark Lookup(BOOKMARK:([Bmk1000]), OBJECT:([Northwind].[dbo].[pedido_sqlmag]))

�� |--Index Seek(OBJECT:([Northwind].[dbo].[pedido_sqlmag].[ix_pedido_sqlmag]),

�� SEEK:([pedido_sqlmag].[empresa]=Convert([@1])

�� AND [pedido_sqlmag].[filial]=Convert([@2])

�� AND [pedido_sqlmag].[nro_pedido]=Convert([@3]))

�� ORDERED FORWARD)

Listagem 6

�

7 - Vamos inserir agora 3 linhas para especificar uma filial diferente (por exemplo filial=10) daquela utilizada na inser��o dos registros no passo 2.

�

insert into pedido_sqlmag (empresa,filial,nro_pedido,vlr_pedido)� values (1,10,25,50)

insert into pedido_sqlmag� (empresa,filial,nro_pedido,vlr_pedido) values (1,10,26,51)

insert into pedido_sqlmag� (empresa,filial,nro_pedido,vlr_pedido) values (1,10,27,52)

�

Nota

Se executarmos outro dbcc show_statistics ap�s as inser��es, obteremos o mesmo resultado do item 5 pelo fato de os tr�s registros inseridos n�o possu�rem representatividade suficiente para alterar as informa��es de densidade das colunas empresa e filial em All Density.

�

8 - Observe agora na figura 2 o plano de execu��o gerado para que o comando select criado pudesse resgatar as 3 linhas inseridas no item anterior.

�

Observe que, apesar de existirem somente 3 registros na condi��o apresentada pela query, o �ndice ix_pedido_sqlmag N�O foi utilizado pela aus�ncia de estat�sticas relacionadas � distribui��o de dados na coluna filial. A informa��o de densidade fornecida em All Density n�o � representativa para as 3 linhas inseridas no passo 7. O histograma tamb�m n�o traz nenhum benef�cio, apenas informa que a maioria de linhas na tabela pedido_sqlmag pertence � empresa de c�digo 1, o que n�o apresenta nenhuma vantagem para a consulta no que se refere ao desempenho.

�

imagem

Figura 2 -� Plano de execu��o gerado para comando select, filtrando empresa e filial.

�

9 � Agora, habilite novamente a op��o auto create statistics no banco de dados NorthWind

�

exec sp_dbOption 'NorthWind','auto create statistics','TRUE'

�

Observe que no select executado no item-8, o �ndice n�o foi utilizado pois a distribui��o de dados para a coluna Empresa informava que o �ndice ix_pedido_sqlmag possu�a seletividade muito baixa, j� que todas as 10.000 linhas da tabela possu�am� Empresa=1. Como n�o existem estat�sticas que indiquem que esse mesmo �ndice � bastante seletivo para Filial=10, sua utiliza��o foi descartada no plano de execu��o.�

�

10 - Gere o plano de execu��o gr�fico para o mesmo select do passo 8. Note que, na Figura 3, o Table Scan foi substitu�do por um Index Scan.

�

imagem

Figura 3 - Plano de execu��o alterado pela exist�ncia de estat�sticas para a coluna filial.

�

11 - Para concluir o teste, execute novamente o select na tabela SysIndexes (ver Listagem 7).

�

select id_indice=indid,� nome_indice= left(name,50),� nro_linhas = rows� from sysindexes

where id=object_id('pedido_sqlmag')

----------------------------------------------------------------------------------------------------

�

id_indice�� nome_indice�� nro_linhas�

------------�� --------------------------� --------------

0�� pedido_sqlmag�� 10000

2�� ix_pedido_sqlmag�� 10000

3�� WA_Sys_filial_17F790F9�� 0

Listagem 7

�

Ao executar o mesmo select do item 4 na tabela SysIndexes, constate a cria��o de um suposto �ndice de nome _WA_Sys_filial_17F790F9. A inser��o da linha para indid=3 n�o representa um �ndice, mas sim estat�sticas de distribui��o geradas automaticamente pelo banco. Como a informa��o de densidade para o conjunto empresa e filial era pouco significativa, o SQL Server 2000 optou por gerar estat�sticas na forma de um histograma para a coluna filial, de modo a auxili�-lo na escolha do plano de execu��o.

�

Nota

O nome da coluna sobre o qual a estat�stica foi criada est� explicitado depois do prefixo �wa_sys�

�

Executando agora um dbcc show_statistics sobre _WA_Sys_filial_17F790F9, verificaremos no histograma da Listagem 8 que a estat�stica _WA_Sys_filial_17F790F9 � ALTAMENTE SELETIVA PARA FILIAL=10, justificando a escolha da estat�stica no plano de execu��o da consulta.

�

Statistics for collection '_WA_Sys_filial_17F790F9'.

Updated�� Rows�� Rows Sampled�� Steps� Density�� Average key length��

----------------------------------------------------------------------------------------------------

Sep 10 2003� 6:04PM� 10003�� 10003�� 2�� 0.0�� 2.0

�

All density�� Average Length�� Columns��

----------------------------------------------------------------------------------------------------

0.5�� 2.0�� filial

�

RANGE_HI_KEY�� RANGE_ROWS� EQ_ROWS�� DISTINCT_RANGE_ROWS�� AVG_RANGE_ROWS��

----------------------------------------------------------------------------------------------------

5�� 0.0�� 10000.0�� 0�� 0.0

10�� 0.0�� 3.0�� 0�� 0.0

Listagem 8 � Histograma de acesso � coluna filial.

�

Apesar de a estat�stica n�o fazer nenhuma refer�ncia direta ao �ndice ix_pedido_sqlmag, este foi utilizado, uma vez que o otimizador busca estat�sticas de distribui��o sobre as colunas que comp�em o �ndice (lembrando que as estat�sticas sobre a primeira coluna do �ndice encontram-se no pr�prio �ndice).

Caso tiv�ssemos mais de um �ndice utilizando o campo Filial, o processo de sele��o do �ndice pelo otimizador levaria em conta as colunas presentes no comando select e procuraria identificar um �ndice que deixasse a query �coberta� (*).

�

(*) Queries cobertas ou �covered queries� s�o aquelas onde todas as colunas presentes no� comando select fazem parte de um �ndice.

�

Nota

A query abaixo serve para identificar se um objeto � uma estat�stica ou um �ndice, na tabela SysIndexes

�

select id_indice=indid,

�� nome_indice=left(name,30),nro_linhas=rows ,

�� tipo = case when IndexProperty(object_id('pedido_sqlmag'),name,'IsStatistics') = 1

�� then 'Estatistica'

�� else 'Indice'

�� end

from sysindexes

where id=object_id('pedido_sqlmag')

�

---------------------------------------------------------------------------------------------------------------------------------------

id_indice nome_indice�� nro_linhas�� tipo��

--------- ------------------------------�� -------------�� -----------

0�� pedido_sqlmag�� 10000�� Indice

2�� ix_pedido_sqlmag� ��10000�� Indice

3�� _WA_Sys_filial_17F790F9�� 0�� Estatistica

�

Dicas sobre manipula��o de estat�sticas

�

�� Mantenha auto create statistics habilitado;

�� Mantenha auto update statistics habilitado;

�� Tenha em mente que �ndices com seletividade baixa s�o ineficientes. A simples exist�ncia de um �ndice n�o implica em sua utiliza��o pelo otimizador. Em geral, se a seletividade de uma chave for inferior a 0.85, o �ndice n�o ser� utilizado;

�� N�o se esque�a de atualizar as estat�sticas ap�s comandos de manipula��o em massa de registros;

�� Considere a execu��o do Index Tunning Wizard. No Enterprise Manager, selecione Tools\Wizards\Manangement\Index Tunning Wizard para reavalia��o de seus �ndices e estat�sticas;

�� Procure reservar a coluna mais seletiva para o primeiro segmento.� A cria��o de um �ndice gera tamb�m um histograma de distibui��o para o primeiro segmento da chave. Se essa coluna for bastante seletiva, n�o ser�o necess�rias estat�sticas adicionais para as outras colunas, o que deixar� o processo de otimiza��o mais r�pido e eficiente e aumentar� muito as chances de utiliza��o do �ndice no processo de otimiza��o da query;

�� Revise periodicamente as estat�sticas criadas em suas tabelas. Lembre-se que, se voc� executar um select sobre uma coluna que n�o possua �ndices, ser�o geradas automaticamente estat�sticas sobre a distribui��o de dados nessa coluna. Se esse select n�o for executado regularmente (foi uma query ad-hoc), � aconselh�vel dropar essas estat�sticas (*) com o comando DROP STATISTICS <nome-da-tabela>,<nome-da-estatistica>. Por outro lado, se essa coluna for utilizada constantemente, crie um �ndice para essa coluna. Para listar as estat�sticas geradas para as colunas de uma tabela, utilize o comando sp_HelpStats <nome-da-tabela>.

�

(*) Voc� tamb�m pode deixar a cargo do SQL Server 2000 a remo��o de estat�sticas criadas automaticamente e que� n�o sejam� mais utilizadas pelo otimizador. O SQL Server 2000 possui um rel�gio interno que dropa automaticamente as estat�sticas ap�s um longo tempo de inatividade.

���

Conclus�o

Entender como funcionam as estat�sticas nos ajudam a: (1) criar �ndices que ser�o efetivamente utilizados pelo otimizador e; (2) evitar a cria��o de �ndices ineficientes. Nas pr�ximas edi��es, daremos continuidade a esse assunto e nos aprofundaremos na arquitetura de �ndices utilizada pelo SQL Server 2000. At� breve!

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Paulo Em 2008

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

artigo SQL Magazine 9 - Estat�sticas de Distribui��o de Dados no SQL Server

Artigo da Revista SQL Magazine -Edi��o 11.

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Perguntas frequentes

Nossos casos de sucesso