artigo SQL Magazine 02 - Otimiza��o de SQLs e Tunning de Banco de Dados SQL Server

Otimizaç�o e tunning de um banco de dados SQL Server 2000 definitivamente n�o � uma ci�ncia exata : existem o que podemos chamar de �regras de boa conduta� que devem ser implementadas de modo a extrair o m�ximo de performance, mas nem sempre as configuraç�es v�lidas num determinado ambiente poder�o ser aplicadas com o mesmo �xito noutra configuraç�o, isso porqu� para que seja feito um ajuste fino na base de dados s�o necess�rios esforços bastante abrangentes, que v�o desde a an�lise de c�digos Transact SQL at� a an�lise do hardware do servidor (mem�ria, discos, processador e rede) .Nessa mat�ria, analisaremos o plano de execuç�o de queries, forneceremos tamb�m dicas sobre otimizaç�o de c�digos Transact SQL e finalizaremos com um breve estudo sobre bloqueios.

An�lise do plano de execuç�o de uma query no SQL Server 2000

Analisaremos um comando �select� executado no database NorthWind conforme a seguir, presente nas instalaç�es default do SQL Server 2000:

select * from [NorthWind].[dbo].[Orders] o inner join [Northwind].[dbo].[Order Details] od on o.OrderID = od.OrderID where o.orderid =10248

As tabelas utilizadas �Orders� e �Orders Details� (Figura 1) tiveram seus �ndices alterados conforme demonstrado na Figura 2. O plano de execuç�o gerado pode ser obtido diretamente no Query Analyzer, selecionando �Display Estimated Execution Plan� na opç�o �Query� e os detalhamentos em amarelo na Figura 3 s�o obtidos ao posicionar o cursor no respectivo objeto. Toda an�lise descrita a seguir refere-se a Figura 4.

Figura 1. Estrutura de �Orders� e �Orders Details� no database �NorthWind�

order details	PK_Order_Details	clustered, unique, primary key located on PRIMARY	OrderID, ProductID
order details	ProductID	nonclustered located on PRIMARY	ProductID
Orders	CustomerID	nonclustered located on PRIMARY	CustomerID
Orders	OrderDate	nonclustered located on PRIMARY	OrderDate
Orders	PK_Orders	nonclustered located on PRIMARY	OrderID

Figura 2.Composiç�o dos indices em �Orders� e �Orders Details�

Figura 3. An�lise do plano de execuç�o da query

Figura 4. An�lise completa

A leitura do plano de execuç�o deve ser efetuada da direita para a esquerda, de cima para baixo. A espessura das linhas que ligam os objetos � diretamente proporcional ao custo da operaç�o (calculado pela relaç�o nro.linhas X tamanho da linha), portanto fique atento �s linhas mais grossas

Cada objeto presente no plano de execuç�o representa uma etapa desenvolvida pelo SQL Server 2000. Percorrendo o gr�fico, os objetos (1) e (3) indicam que o otimizador est� utilizando �ndices para pesquisas pontuais (=seek). A pesquisa efetuada em �Orders� est� sendo realizada por um �ndice cluster (�Clustered Index Seek�; item (1)); j� a pesquisa em �Orders Details� � efetuada por um �ndice n�o cluster (�Index Seek�; item(3)). Pesquisas to tipo �seek� s�o bastante eficientes; fique atento quando se deparar com acessos do tipo �scan� � �Table Scan� ou �Clustered Index Scan�, que indicam varreduras sequenciais por toda a tabela, fatores que degradam bastante a performance das queries. Acessos do tipo �scan� normalmente se devem a pesquisas efetuadas com argumentos insuficientes na clausula �where�, ou �ndices n�o qualificados para a pesquisa, exceç�o seja feita a tabelas com pequeno n�mero de registros, onde um �scan� efetuado diretamente na �rea de dados se torna mais econ�mico que o esforço adicional causado pela pesquisa no �ndice.

Um detalhe importante � que a escolha dos �ndices apropriados se baseia em estat�sticas pr�-armazenadas a respeito da distribuiç�o de dados na tabela. O SQL Server 2000 calcula estat�sticas automaticamente para o PRIMEIRO segmento dos �ndices; portanto fique atento a esse detalhe � selecione para o primeiro segmento de um �ndice composto a coluna mais seletiva (=menor �ndice de ocorr�ncias). Se esse detalhe n�o for observado, o SQL Server 2000 poder� n�o escolher seu �ndice pelo fato da seletividade ser baixa. Note que voc� pode criar manualmente estat�sticas para as outras colunas envolvidas no �ndice, eliminando esse problema. Ainda com relaç�o �s estat�sticas uma atenç�o especial deve ser dada para textos em vermelho no plano de execuç�o, eles mostram estat�sticas desatualizadas. Se for esse o caso, proceda � atualizaç�o.

O objeto �BookMark Lookup� no item(2) indica que, para cada registro lido no �ndice n�o cluster �Orders.PK_Orders� � necess�rio uma leitura adicional na tabela, pelo fato do �ndice n�o contemplar todas as colunas requisitadas na linha do comando �select�. Uma maneira de se evitar esse passo adicional � a criaç�o de �ndices que contemplem todas as colunas requeridas na linha do �select� (conhecido como �covered index�). Criaç�o de �ndices adicionais, contudo, devem ser vistos com cautela para que n�o impactem em m� performance em operaç�es de alteraç�o de dados (inserts/updates/deletes).

O pr�ximo passo na resoluç�o da query � a escolha do tipo de join para resolver a query. Em nosso �select�, o tipo escolhido foi o �Nested Loop�, em funç�o da alta seletividade nas tabelas envolvidas. Abaixo, s�o detalhadas as caracter�sticas dos tr�s modelos poss�veis de join, a saber: Nested Loop, Merge Join e Hash Join.

Nested Loop: o otimizador elege uma tabela (conhecida por �Outer Table�) que servir� de base para a varredura de registros. A cada registro lido nessa tabela, � efetuada uma busca pelo registro correspondente na outra tabela participante do join (conhecida por �Inner Table� e esta deve possuir �ndice adequado para busca). Esse m�todo � bastante eficiente quando uma das tabelas possui quantidade pequena de registros (ou o join possui filtros que tornam o result-set pequeno) e a outra um �ndice adequado formado pela(s) coluna(s) que unem as duas tabelas. A tabela com menor n�mero de registros ser� definida como Outer Table.

Merge Join: se as duas tabelas possu�rem �ndices adequados, que permitam sortear o conte�do das tabelas participantes do join (considerando os filtros estabelecidos na cl�usula �where�) esse tipo ser� o escolhido. O otimizador recupera uma coluna de cada lista sorteada, efetuando a comparaç�o. Em caso de igualdade, retorna as colunas selecionadas. Caso contr�rio, a coluna de menor valor ser� descartada, obtendo o pr�ximo valor dessa mesma lista onde foi efetuado o descarte. O processo se repete at� que todas as linhas tenham sido processadas. Esse tipo de join � bastante eficaz, normalmente sendo utilizado para tabelas com grande n�mero de registros, que inviabilizam o Nested Loop.

Hash Join: se n�o existirem �ndices adequados para a igualdade definida no join, esse m�todo ser� utilizado. Para que o join possa acontecer, o otimizador precisar� de uma maneira bastante r�pida de indexar as duas tabelas, por isso utiliza um algoritmo de hash para codificar as colunas envolvidas no join e estabelecer a combinaç�o.Unir duas tabelas sem �ndices apropriados ou com baixa seletividade � um fator de queda de performance, portanto investigue as ocorr�ncias desse tipo de join.

Ap�s a escolha do tipo de join, a query � executada retornando o select para a estaç�o

Abaixo, s�o listados mais alguns objetos importantes na avaliaç�o do plano de execuç�o. A lista completa dos objetos utilizados pelo otimizador na resoluç�o de queries pode ser obtida no procurando por �execution plan icons� na guia �Search� do SQL Server Books On Line. Ap�s pesquisa, selecione �Graphically Displaying the Execution Plan Using SQL Query Analyzer�. (ou no endereço http://msdn.microsoft.com/library/default.asp?url=/library/en-us/optimsql/odp_tun_1_5pde.asp)

Assert: utilizado para verificar certas condiç�es (integridade referencial (FK), check constraint, etc) agindo como uma esp�cie de filtro para os registros envolvidos na operaç�o.
Compute Scalar: esse operador � utilizado pelo otimizador para retornar sa�das envolvendo valores calculados (�computed columns�, funç�es, etc.).
Index Spool, Row Count Spool e Table Spool: indicam que foi necess�ria a criaç�o de tabela tempor�ria no database tempdb para rodar a query. Esse passo muitas vezes pode ser evitado reescrevendo-se o join.
Parallelism: indica que a query est� sendo executada em mais de um processador. Em m�quinas multi-processadas, o otimizador poder� quebrar queries complexas e execut�-las em paralelo, normalmente ganhando performance. A opç�o pela execuç�o em paralelo depende de uma s�rie de circunst�ncias como atividade do servidor no momento da execuç�o e complexidade da query. Existem algumas opç�es que podem ser configuradas no servidor envolvendo paralelismo, entre elas �max degree of parallelism�, que liga/desliga a execuç�o em paralelo e �cost threshold for parallelism�, que estabelece uma projeç�o m�nima de tempo para que a query seja executada em paralelo.
Sort: indica que o objeto est� sendo sorteado, presente quando voc� utiliza a cl�usula �order by� ou tamb�m quando o input precisa ser ordenado para resoluç�o do join, nesse �ltimo caso degradando performance (a tabela n�o possui �ndice adequado).
Stream Aggregate: aparece quando utilizamos as cl�usulas que agregam valores -�avg�,�distinct�,�sum�, �max�,�min�ou �count�

Dicas para otimizaç�o de c�digos Transact-SQL

1 ) Conheça os passos dados pelo otimizador para resolver uma query :

Identificaç�o dos argumentos de pesquisa (=SARGS O QUE EH SARGS?, utilizados na cl�usula �where�) e colunas mencionadas no join ;
Seleç�o do �ndice apropriado, baseando-se nos SARGS. Os �ndices s�o avaliados em funç�o de sua seletividade, utilizando para isso as estat�sticas de distribuiç�o. Ser� escolhido o �ndice que requerer um menor n�mero de leituras para resolver o �select� ;
Avaliaç�o dos tipos de join poss�veis e ordem apropriada de acesso �s tabelas. Isso quer dizer que o otimizador definir� a tabela-base do join, independente da ordem especificada no comando �select�. Os comandos a seguir s�o id�nticos :

Listagem 1. Select�s id�nticos para o otimizador

select o.OrderId
 from 
    [NorthWind].[dbo].[Orders] o   
 inner join                                                        
    [Northwind].[dbo].[Order Details] od
 on o.OrderID = od.OrderID

Seleç�o do melhor plano de execuç�o, baseado nos custos calculados no item 3.

2 ) Limite sua busca restringindo ao m�ximo o n�mero de colunas solicitadas na cl�usula �select�. Colunas adicionais, al�m de consumir mais recursos de I/O e largura de banda, muitas vezes inibem a utilizaç�o de �ndices ou causam buscas desnecess�rias na �rea de dados � partir do �ndice (bookmark lookup).

3 ) Filtre sempre o resultado de suas pesquisas, fornecendo par�metros de busca que se adequem � estrutura dos �ndices existentes, obedecendo a ordenaç�o de suas colunas.

Ex: para o �ndice composto PK_Order_Detals, formado pelas colunas OrderId e ProductId, � fundamental que uma pesquisa forneça pelo menos o n�mero da ordem a ser pesquisada (OrderId). Fornecendo somente ProductId, torna pouco prov�vel a utilizaç�o do �ndice pelo otimizador.

4 ) Evite utilizaç�o de funç�es diretamente sobre colunas pesquisadas, que inibem a utilizaç�o de �ndices. Ex:

substitua ... where substring(ShipName,1,1) = �M�
 por  ���where ShipName like (�M%�)

Se n�o for poss�vel evitar a funç�o, considere a criaç�o de �ndices sobre colunas calculadas:

select datepart(month,ShippedDate)
  from [NorthWind].[dbo].[Orders] 
 where datepart(month,ShippedDate)=7

Pode ser otimizado se criarmos um �ndice sobre uma coluna calculada:

alter table [NorthWind].[dbo].[Orders]
add Month_OrderDate as datepart(month,ShippedDate)
create index IX_Month_OrderDate 
 on [NorthWind].[dbo].[Orders](Month_OrderDate)

Podemos agora reescrever o �select� :

select Month_OrderDate 
from [NorthWind].[dbo].[Orders] 
where Month_OrderDate=7

Repare que o �Table Scan� foi substitu�do por um �Indes Seek� !

5 ) Utilize tabelas derivadas em oposiç�o � tabelas tempor�rias. Tabela derivada � o resultado da utilizaç�o de um comando select ap�s a clausula �from� num �select� existente. Apenas para efeito de exemplo :

select o.EmployeeId,od.Quantity
from [NorthWind].[dbo].[Orders] o
inner join
 ( select * from [Northwind].[dbo].[Order Details] od where ProductId=11 ) as od
on o.OrderID = od.OrderID

6 ) Lembre-se que �ndices existem para comparar igualdades. Evite a utilizaç�o de operadores do tipo �<>�,�!>�,�!<�, �NOT�. A utilizaç�o de �l�gica negativa� inibe a escolha de �ndices pelo otimizador.

7 ) Para fins de performance, considere a utilizaç�o de Indexed Views. A utilizaç�o de views simplifica bastante a programaç�o, mas n�o otimiza performance, haja visto que seu c�digo � executado de maneira integral a cada solicitaç�o.

8 ) Se a sua query utiliza agrupamentos e filtragem de dados na cl�usula �having�, considere a opç�o de filtragem diretamente na cl�usula �where�, reduzindo significativamente o trabalho do �group by�, j� que um n�mero menor de registros dever�o ser processados.

9 ) Utilize a cl�usula �like� com crit�rio. Lembre-se que o comando �� where name like(�SQL%�)� utilizar� um �ndice formatado para a coluna �name�, se esse �ndice existir. J� o comando �� where name like (�%SQL�) � realizar� um table scan (ou clustered index scan, se a tabela possuir �ndice cluster) na tabela em quest�o.

10 ) Evite ao m�ximo a utilizaç�o de cursor nos servidores. Experimente reescrever o c�digo utilizando subqueries, tabelas derivadas, tabelas tempor�rias ou mesmo a cl�usula �case�.

11 ) Sempre que poss�vel, utilize vari�veis do tipo �table� em oposiç�o � tabelas tempor�rias.

12 ) Para monitoramento, utilize o Profiler para capturar as queries mais demoradas, analisando seu plano de execuç�o.

13 ) Existem duas configuraç�es de servidor que podem ser utilizadas para limitar o tempo de execuç�o de uma query, s�o elas : �query governor cost limit� e �query wait�. A primeira (�query governor�) � baseada numa projeç�o de tempo de execuç�o da query calculada pelo otimizador: se o tempo projetado for superior ao limite pr�-definido nessa configuraç�o a query � abortada ANTES de sua execuç�o. �Query wait� simplesmente aborta uma query se esta superar o limite estabelecido nesse par�metro, o que pode ser desastroso principalmente se a transaç�o for extensa e j� houver adquirido muitos locks. Como sugest�o, avalie a opç�o �query governor�. Implante limites que voc� considera suficientes para seu ambiente (com boa margem de segurança !) e v� reduzindo gradativamente, at� chegar ao ponto �timo.

Fatores que afetam performance : an�lise de bloqueios e deadlocks

Bloqueios s�o fundamentais para garantia da consist�ncia de dados em transaç�es. O isolamento fornecido por um bloqueio no SQL Server 2000 permite que uma transaç�o n�o efetue leituras ou modifique dados que est�o sendo utilizados por outra transaç�o.

Existem v�rios tipos de locks, cada um estabelecendo o isolamento necess�rio para comandos de manipulaç�o de dados (select / insert / update / delete). O tipo de lock (shared, update, exclusive, shema lock ou bulk update lock) � selecionado automaticamente pelo SQL Server 2000 a menos que voc� utilize um hint, o que n�o � aconselh�vel.

O SQL Server 2000 trabalha com escalonamento de locks, permitindo que um bloqueio de registro seja promovido para um bloqueio de p�gina ou de tabela. O escalonamento possibilita a economia de recursos (um lock consome 64 bytes de mem�ria), pois ao promover um lock os bloqueios de n�vel menor s�o liberados. Como ilustraç�o, imagine uma operaç�o de update envolvendo todas as 1000 linhas de uma tabela - o que seria mais eficiente: 1000 locks de registro ou um lock de tabela ? � l�gico que a segunda opç�o, j� que todas as linhas ser�o atualizadas.

O problema relacionado a bloqueios adv�m de seu tempo de duraç�o. Bloqueios curtos s�o eficientes, bloqueios longos s�o um transtorno. Alguns fatores que acarretam no aumento da duraç�o de bloqueios s�o transaç�es longas, aus�ncia, excesso ou inefici�ncia de �ndices, n�vel de isolamento das transaç�es, bases de dados n�o normalizadas, utilizaç�o indiscriminada de cursores, etc. Nesses ambientes, as mensagens de erro envolvendo query timeout (#1222) ou deadlocks (#1205) tendem a ocorrer com mais freq��ncia.

Query timeout acontece quando, ao executar um comando de manipulaç�o de dados, aguardamos sua conclus�o por tempo superior a um limite previamente estabelecido. J� deadlocks acontecem quando dois processos ficam aguardando pela liberaç�o de recursos que o outro processo mant�m, situaç�o essa que � resolvida pelo SQL Server 2000 finalizando-se a conex�o que consumir menos recursos.A seguir temos os c�digos para gerar dois tipos de deadlock: c�clicos e de convers�o.

Tipo c�clico:

Abra duas sess�es no Query
Na sess�o-1, execute o cmd abaixo:
begin tran update [NorthWind].[dbo].[order details] set discount=1 where orderid=10248 and productid=11
Na sess�o-2, execute:
begin tran update [NorthWind].[dbo].[orders] set employeeid=4 where orderid=10248
Voltando na sess�o-1, execute :
update [NorthWind].[dbo].[orders] set employeeid=5 where orderid=10248 commit
O update acima ficar� travado, aguardando a liberaç�o do recurso, bloqueado na sess�o-2
Na seç�o-2, execute:
update [NorthWind].[dbo].[order details] set discount=0 where orderid=10248 and productid=11 commit
Nesse momento acontece o deadlock :
Server: Msg 1205, Level 13, State 50, Line 1 Transaction (Process ID 70) was deadlocked on lock resources with another process and has been chosen as the deadlock victim. Rerun the transaction.

Tipo Convers�o:

Abra duas sess�es no Query Analyzer
Na sess�o-1, execute o cmd abaixo:
begin tran select * from [NorthWind].[dbo].[Orders] (holdlock) where orderid=10248
Na sess�o-2, execute o mesmo comando:
begin tran select * from [NorthWind].[dbo].[Orders] (holdlock) where orderid=10248
Voltando na sess�o-1, execute :
update [NorthWind].[dbo].[Orders] set employeeid=4 where orderid=10248 commit
O update acima ficar� travado, aguardando a liberaç�o do recurso, bloqueado na sess�o-2
Na seç�o-2, execute:
update [Northnd].[dbo].[Orders] set employeeid=5 where orderid=10248 commit
Nesse momento acontece o deadlock :
Server: Msg 1205, Level 13, State 50, Line 1 Transaction (Process ID 70) was deadlocked on lock resources with another process and has been chosen as the deadlock victim. Rerun the transaction

Uma das maneiras de se monitorar as transaç�es envolvidas num deadlock � ativar as trace flags 3605 e 1204, que geram informaç�es detalhadas no log do SQL Server 2000 � respeito do deadlock. Execute �dbcc traceon(3605) dbcc traceon(1204) � para habilitar as trace flags; �dbcc traceoff (3605) dbcc traceoff (1204)� para desabilitar.

Outra possibilidade de monitoramento � atrav�s do SQL Profiler, habilitando-se o evento �Lock: DeadLock Chain�, que produz resultado semelhante �s trace flags habilitadas acima.

Um aspecto interessante � que a duraç�o de um lock � ilimitada no SQL Server 2000. Portanto se voc� n�o quiser que um processo aguarde indefinidamente pela liberaç�o de um lock mantido noutra sess�o, utilize em sua sess�o a cl�usula LockTimeOut (set LockTimeOut ) antes de comandos de manipulaç�o de dados e efetue tratamento para erros de c�digo #1222.

Minimizar tempo de bloqueios implica no cumprimento de algumas regras, a saber:

Mantenha suas transaç�es �enxutas� � quanto menos c�digo melhor; lembre-se que quanto menor o tempo gasto por um bloqueio menor ser� a possibilidade de ocorr�ncias de deadlocks e travamentos ;
Estude a possibilidade de quebrar horizontal e/ou verticalmente tabelas com grande n�mero de registros. Dados distribu�dos permitem maior concorr�ncia, j� que os locks que originalmente incidiam sobre um objeto est�o dispersos em outras tabelas;
Procure atualizar tabelas nas transaç�es seguindo sempre a mesma ordem, evitando assim a ocorr�ncia de deadlocks c�clicos (Figura 7) ;
Evite a utilizaç�o de select com hint �holdlock� seguidos de um update. Essa combinaç�o explosiva � causa freq�ente de deadlocks de convers�o (Figura 8);
Efetue expurgos peri�dicos em suas bases OLTP; n�o mantenha dados hist�ricos em sua base de produç�o. Operaç�es em tabelas com grande n�mero de registros tendem a ser mais demoradas;
N�o crie �ndices desnecessariamente em bases OLTP. Um �ndice criado para otimizar uma query representar� overhead nas operaç�es de atualizaç�o de dados;
Utilize sp�s em oposiç�o a batchs. Por estarem residentes no servidor e muitas vezes com planos de execuç�o cacheados, as sp�s apresentam performance superior;
Trabalhe com locks otimistas em situaç�es em que a leitura e modificaç�o de dados representem processos com consider�vel separaç�o de tempo. Use e abuse de colunas do tipo �TimeStamp� para essa finalidade. Ex: vamos supor que uma ordem de compra possa ser alterada em v�rios locais por v�rios vendedores. Seria interessante que dois vendedores n�o alterassem a mesma ordem ao mesmo tempo; poderiam alterar colunas diferentes e somente a �ltima alteraç�o se tornaria vigente. Para resolver esse tipo de quest�o, crie uma coluna chamada �OrderTS�, do tipo �timestamp� e, ao efetuar a leitura do registro na aplicaç�o de front end, carregue o valor dessa coluna. Depois que o vendedor efetuar as alteraç�es necess�rias, submeta o registro � atualizaç�o, fornecendo o valor da coluna timestamp como argumento de pesquisa. Se o registro n�o for encontrado significa que aconteceram alteraç�es concorrentes, sendo necess�rio uma releitura na base para posterior revis�o pelo vendedor.

1 ) Adicionar coluna TS tipo TimeStamp em [Orders]

Alter table [Orders] add TS timestamp

2 ) Efetuar leitura de colunas da tabela Orders, submetendo-as a aplicaç�o de front-end

declare @ShipName varchar (80)
 declare @ShipAddress varchar(120)
 declare @TS binary (8)
  
 select  @ShipName=ShipName
          ,@ShipAddress=ShipAddress 
          ,@TS=TS 
 from [Orders] where OrderId=10248

3 ) Ap�s alteraç�es pelo vendedor, submeter o comando de update fornecendo a coluna timestamp guardada no passo anterior:

update [Orders]
set  ShipName       = @ShipName
      , ShipAddress = @ShipAddress
 where OrderId =10248 and TS=@TS
 if @@rowcount = 0 
 begin
      /* 
        Significa que o registro foi alterado noutra sess�o ; a aplicaç�o dever� ser desviada 
        para o passo-2, relendo a ordem submetendo-a novamente � an�lise do vendedor 
     */
     raiserror ('Ordem alterada por outro vendedor. Verifique !',11,1)
 end

Conclus�o

Normalmente s� pensamos em otimizaç�o no momento em que nos deparamos com situaç�es realmente cr�ticas de performance, quando pode ser tarde demais.

artigo SQL Magazine 02 - Otimiza��o de SQLs e Tunning de Banco de Dados SQL Server

Artigo da Revista SQL Magazine -Edição 2.

An�lise do plano de execuç�o de uma query no SQL Server 2000

Dicas para otimizaç�o de c�digos Transact-SQL

Fatores que afetam performance : an�lise de bloqueios e deadlocks

Conclus�o

Artigos relacionados