Aten��o: esse artigo tem um v�deo complementar. Clique e assista!

De que se trata o artigo:

O artigo aborda como utilizar t�cnicas de programa��o paralela para executar instru��es SQL como INSERT, SELECT, UPDATE e DELETE mais rapidamente no SQL Server. S�o apresentadas t�cnicas, testes e coment�rios sobre o uso de paralelismo em banco de dados.

Em que situa��o o tema � �til:

A utiliza��o de t�cnicas de programa��o paralela em instru��es SQL � �til para otimizar o desempenho e executar mais rapidamente instru��es INSERT, UPDATE, DELETE e SELECT que trabalhem com grandes quantidades de dados em computadores com m�ltiplos n�cleos.

Resumo DevMan:

A utiliza��o de m�ltiplos n�cleos em um microprocessador � uma realidade nos computadores atuais. Contudo, poucos programadores s�o capazes de extrair o m�ximo potencial deste recurso. Com base neste contexto, este artigo apresenta como implementar t�cnicas de programa��o paralela no banco de dados SQL Server. Uma solu��o que utiliza um assembly .NET � apresentada junto com diversos testes de desempenho que comprovam a melhoria nos tempos execu��o. Em geral, os testes de desempenho mostram que os ganhos obtidos nas execu��es de instru��es SELECT, INSERT, UPDATE e DELETE s�o de aproximadamente 79%.

O principal componente de um computador moderno � o microprocessador. Este componente vem recebendo cada vez mais tecnologias inovadoras para atender as demandas de processamento da maioria das aplica��es independente de �rea de especializa��o, dispositivos ou ambientes. Uma das principais tecnologias que vem sendo aprimorada, junto com o aumento do clock do microprocessador, envolve o emprego de m�ltiplos n�cleos. De fato, a maioria dos fabricantes de microprocessadores atualmente investe mais na capacidade de multiprocessamento atrav�s de diversos n�cleos (cores) do que no aumento da quantidade de instru��es que podem ser executadas a cada ciclo do microprocessador. Este investimento � observado nos microprocessadores equipados tanto em computadores desktop e servidores como em dispositivos m�veis (smartphones e tablets) que j� est�o recebendo microprocessadores com m�ltiplos n�cleos.

Contudo, infelizmente o desenvolvimento atual de software n�o consegue acompanhar o crescimento tecnol�gico proporcionado pelas arquiteturas de m�ltiplos n�cleos. Isso implica que em quase todas as aplica��es o uso do microprocessador � subutilizado, pois os desenvolvedores n�o utilizam as t�cnicas corretas para obter o m�ximo desempenho do microprocessador. Uma das maneiras de se explorar a maior utiliza��o dos microprocessadores de m�ltiplos n�cleos � o emprego de t�cnicas de programa��o paralela. Com base neste contexto, este artigo apresentar� como � poss�vel aplicar algumas das t�cnicas de processamento paralelo junto com banco de dados, uma �rea que, infelizmente, possui poucos recursos para a explora��o de tais t�cnicas.

Neste contexto, este artigo apresentar� como obter ganhos de desempenho significativos quando se utiliza t�cnicas de paralelismo em instru��es SQL como SELECT, INSERT, UPDATE e DELETE atrav�s de diversos testes e an�lises dos tempos de execu��o. O artigo abordar� aspectos da programa��o de instru��es paralelas no SQL Server e pode ser utilizado como base para implementar as ideias aqui apresentadas em outros contextos, instru��es, bancos de dados e conjunto de opera��es.

Processamento paralelo

O processamento paralelo geralmente � visto como uma �rea � parte da programa��o e que, infelizmente, n�o � ensinada e disseminada entre a maioria dos desenvolvedores. Apesar da sua extrema import�ncia n�o apenas para aplica��es cient�ficas de alto desempenho, identificadas pela sigla HPC (High Performance Computing) � veja a Nota DevMan 1, s�o raros os exemplos de aplica��es comerciais onde � poss�vel encontrar solu��es que exploram t�cnicas de processamento paralelo para otimiza��o e ganho de desempenho.

Nota DevMan 1. HPC

Computa��o de alto desempenho ou HPC (High Performance Computing) se refere ao uso de supercomputadores ou clusters de v�rios computadores em tarefas que requerem grandes recursos de computa��o, geralmente simula��es num�ricas muito complicadas. � comum classificar um computador como sistemas HPC quando sua performance � de pelo menos alguns teraflops.

Computa��o de alto desempenho (HPC) � um termo que surgiu ap�s o termo supercomputadores. HPC � por vezes utilizado como sin�nimo de supercomputa��o, mas, em outros contextos, supercomputador � usado para se referir a um subconjunto mais poderoso de computadores de alto desempenho.

Um termo relacionado, computa��o de alto desempenho t�cnico (HPTC), geralmente se refere �s aplica��es de engenharia de computa��o baseada em cluster (como din�mica de fluidos computacional e na constru��o e teste virtual de prot�tipos). Recentemente HPC vem sendo aplicada a neg�cios como data warehouses, linha de neg�cios (LOB) e processamento de transa��es.

Neste ponto � importante destacar que o processamento paralelo deve ser diferenciado do processamento distribu�do, pois a primeira �rea se preocupa exclusivamente com otimiza��o do tempo de execu��o enquanto a segunda �rea foca em quest�es como balanceamento de carga, disponibilidade, otimiza��o de recursos (tempo de execu��o, mem�ria, acesso a disco), escalabilidade, seguran�a e outros aspectos.

No contexto de banco de dados � raro encontrar o uso adequado de algumas das principais t�cnicas de processamento paralelo. Um dos motivos para esta aus�ncia est� ligado �s origens da �rea: o armazenamento e o gerenciamento de dados e n�o a execu��o de grandes quantidades de opera��es que se beneficiariam de um processamento otimizado. Contudo, cada vez mais os bancos de dados s�o respons�veis por realizar muitas opera��es nos dados, principalmente devido � execu��o simult�nea de m�ltiplas instru��es SQL realizadas por diversos usu�rios diferentes. A prop�sito, um dos principais testes de desempenho de bancos de dados, popularmente conhecido como TPC (Transaction Processing Performance Council � Nota DevMan 2), foca na capacidade dos bancos de dados em executar transa��es de forma concorrente e n�o em m�tricas espec�ficas para a medi��o de capacidade de processamento, como Flops (veja a Nota DevMan 3).

Nota DevMan 2. TPC

O TPC (ou Transaction Processing Performance Council) � uma organiza��o sem fins lucrativos, tendo como objetivo principal estabelecer crit�rios para se obter informa��es a respeito da performance de processamento de transa��es e de banco de dados atrav�s de benchmarks. Baseia-se em testes padronizados tais como o TPC-C, o TPC-W e o TPC-H para obter tais resultados e s� assim divulgar os dados reais dessa performance. Estes testes do TPC seguem normas extremamente rigorosas que testam diversos pontos do sistema � principalmente nos quesitos confiabilidade e durabilidade. O endere�o do site do TPC � http://tpc.org.

O TPC-C � considerado o benchmark padr�o da ind�stria para avaliar a performance e a escalabilidade de sistemas OLTP. Este se encarrega de testar a maior parte das funcionalidades de um banco de dados, tais como: consultas, atualiza��o e mini-batches de transa��es em filas. Este benchmark mede a taxa de transfer�ncia (throughput) de transa��es de neg�cios por minuto, simulando um ambiente de pedidos que entram no sistema e sua distribui��o. Desta forma, o teste quantifica quantas novas transa��es de pedidos um sistema pode absorver por minuto enquanto esse mesmo sistema executa, simultaneamente, outros quatro tipos de transa��es (pagamentos, atualiza��o do status dos pedidos, distribui��o e altera��o dos n�veis de estoques).

...

Quer ler esse conteúdo completo? Tenha acesso completo