Paralelismo no SQL Server

Por que eu devo ler este artigo:Este artigo tem por objetivo apresentar aspectos do funcionamento da engine do SQL Server no que toca a execu��o de consultas utilizando operadores paralelos, isto �, explorando hardwares que possuem diversos processadores.

O artigo ser� �til para o leitor entender os conceitos de paralelismo, analisar planos paralelos, conhecer detalhes do otimizador de consultas, determinar as corretas configura��es de uma inst�ncia do SQL Server e, naturalmente, ganhar uma s�lida base para aplicar em seu ambiente as melhores pr�ticas, fazendo corretamente o troubleshooting ou tuning de consultas paralelas.

Vivemos um per�odo onde os processadores n�o evoluem mais t�o rapidamente a cada novo ciclo de lan�amento dos fabricantes. Em contrapartida, encontramos cada vez mais processadores em uma �nica m�quina. Diante disso, � necess�rio que os programas passem a explorar o paralelismo em seu c�digo, com m�ltiplas threads em execu��o, potencializando o uso do hardware � sua disposi��o.

O paralelismo possui um objetivo muito nobre, que � explorar a concorr�ncia de processamento em um programa com o objetivo de resolver um problema em menos tempo.

Por�m, � importante frisar que isto n�o significa que o uso de recursos ser� menor, pelo contr�rio, o tempo total de processamento (uso efetivo das CPUs) tende a ser maior, pois al�m da execu��o � necess�rio incluir no c�digo mecanismos de sincroniza��o das threads.

Atualmente � comum encontrarmos inst�ncias do SQL Server em servidores com 16, 32 ou mais n�cleos (cores) de processamento. Diante desse cen�rio, � desej�vel que a engine possa explorar o paralelismo em seu c�digo, ainda mais considerando que o SQL Server � licenciado por n�cleo e n�o por outros fatores como, por exemplo, quantidade de mem�ria.

E mesmo que o c�digo do SQL Server tenha diversos trechos multi-thread, muitos deles n�o podem ser vistos ou s�o transparentes para n�s, �usu�rios�. No entanto, existe um deles, assunto cerne deste artigo, onde podemos ver claramente a utiliza��o de m�ltiplos n�cleos de processamento: os planos de execu��o que possuem operadores paralelos.

Plano de execu��o paralelo

Definimos um plano paralelo como aquele composto por operadores que exploram o paralelismo em sua �rvore de execu��o. Neste contexto, um conjunto de operadores paralelos � o que determina o que chamamos de zona paralela.

As zonas existem pelo fato do plano de execu��o nunca ser 100% paralelo, pois sempre o �ltimo operador deve ser n�o paralelo (serial) para que a engine possa retornar os registros da consulta a partir de uma �nica thread, chamada de coordenadora.

Dito isso, como primeiro exemplo deste artigo, faremos a compara��o entre a execu��o de duas consultas, uma serial e outra paralela, com o intuito de apresentar como s�o processados os registros em um plano com zona paralela.

O detalhamento de como interpretar um plano de execu��o e seus operadores est� al�m do escopo do artigo, por�m � importante que se tenha o conhecimento do que s�o e como podem ser gerados atrav�s do SQL Server Management Studio. Voc� encontra um artigo sobre planos de execu��o na edi��o 119 da SQL Magazine.

Na Listagem 1 demonstramos uma consulta simples, que conta a quantidade de registros na tabela dbo.bigTransactionHistory fazendo uso da hint �MAXDOP 1�, que for�a o SQL Server a n�o utilizar paralelismo para esta consulta. O termo MAXDOP � bastante adotado por ser uma redu��o de MAX Degree Of Parallelism, ou grau m�ximo de paralelismo, e tamb�m ser� empregado ao longo deste artigo.

Listagem 1. Consulta simples, sem paralelismo.


  USE AdventureWorks2012
  GO
   
  SET STATISTICS TIME ON;
  SELECT COUNT(*) FROM dbo.bigTransactionHistory OPTION (MAXDOP 1);
  GO

Como pode ser verificado na Figura 1, o plano de execu��o � simples. O SQL Server opta por percorrer um �ndice n�o cluster por completo (index scan), retornando cada um dos registros para ser contabilizado pelo pr�ximo operador (stream aggregate), e por fim devolvendo o resultado para o cliente (o compute scalar n�o � relevante neste contexto).