Avaliação de recursos do paralelismo

Por que eu devo ler este artigo:Um recurso importante a ser adotado em computa��o � o paralelismo. Em diversas �reas o paralelismo permite melhorias significativas.

O paralelismo de cada hardware, isoladamente, possibilita incremento de performance. Adotar um conjunto que tenha paralelismo em todos os n�veis de hardware (disco, mem�ria e processador) certamente � a op��o ideal do ponto de vista de velocidade nas opera��es realizadas pelo banco de dados. Contudo, do ponto de vista financeiro (custos e investimentos), isso pode n�o ser t�o simples assim.

Neste artigo ser�o descritos e realizados testes que utilizam recursos paralelos apenas de processador e uso de mem�ria. O paralelismo em disco n�o ser� adotado, pois exige discos em n�veis RAID 0 (zero) e configura��es adicionais no sistema operacional. Para utilizar processamento paralelo, podemos adotar processadores gr�ficos oferecidos por placas de v�deo NVIDIA da s�rie 8000 em diante ou ATI HD 7660 em diante. Neste artigo ser� apresentado um comparativo de processamento utilizando apenas o processador principal do computador e, em seguida, o processamento utilizando o processador principal em conjunto com o processador gr�fico.

Neste contexto, este artigo � �til para quem deseja conhecer uma forma de processamento paralelo e aproveit�-la na resolu��o de tarefas que s�o realizadas no mesmo hardware em que est� rodando seu banco de dados. Os processadores atuais disponibilizam v�rios n�cleos (a grande maioria oferece quatro ou mais), com isso podemos explorar a execu��o de tarefas simult�neas em nossos programas. Al�m do processador principal, temos tamb�m os processadores das placas de v�deo. Estes geralmente com um n�mero de n�cleos (core) muito maior, algo entre 96 e 2688, dependendo do modelo.

A programa��o paralela apresentada neste artigo visa demonstrar o uso de processadores gr�ficos para realizar processamento de instru��es independentes de forma simult�nea. Desta forma, ser� poss�vel direcionar o processamento de uma tarefa para o processador gr�fico, enquanto o processador principal fica livre para outras tarefas.

O conceito de paralelismo j� entrou no ambiente dos processadores h� muito tempo. Uma considera��o importante aqui � a separa��o de dois mecanismos distintos: execu��o de instru��es em paralelo (possibilitada pelos m�ltiplos n�cleos), e processamento multitarefa. O �ltimo mecanismo pode ser encontrado em processadores de apenas um n�cleo, onde o tempo de utiliza��o do processador � dividido entre as diversas tarefas dando a impress�o de que todas s�o executadas ao mesmo tempo. J� o mecanismo de instru��es em paralelo s� � poss�vel em processadores com mais de um n�cleo, onde cada n�cleo vai realmente processar algo enquanto o outro processa outra instru��o. � importante destacar que algumas instru��es que dependem de resultados de instru��es anteriores n�o podem ser executadas em paralelo.

Algumas melhorias nos processadores foram poss�veis gra�as �s novas tecnologias de materiais eletr�nicos que permitiram o aumento de componentes em uma mesma �rea de chip. Outras melhorias foram poss�veis atrav�s da l�gica e organiza��o de n�veis de paralelismo de instru��es, isto �, pipelines de dois ou mais est�gios (ler BOX 1).

BOX 1. Pipeline

Internamente, o processador possui diversos est�gios onde as instru��es s�o interpretadas e executadas. Algumas instru��es precisam passar por 2, 3, 4 ou mais est�gios (podendo chegar a 14 dependo do processador). O pipeline visa organizar as instru��es de forma que mesmo que uma instru��o n�o tenha sido realizada por completo, outra instru��o inicie, desta forma otimizando o uso dos diversos est�gios do processador. Como exemplo deste tipo de mecanismo podemos imaginar uma lavanderia, onde um conjunto de roupas deve passar por tr�s est�gios: lavar, secar e passar. Visando a otimiza��o de uma lavanderia: devemos lavar um conjunto de roupas, em seguida podemos enviar este conjunto para o est�gio de secagem, enquanto que um conjunto novo de roupas entra para lavagem, fazendo com que em determinado momento as tr�s m�quinas estejam em funcionamento.

O paralelismo oferecido pelas placas de v�deo difere em muito do paralelismo de instru��es obtido por pipeline, pois o paralelismo visto em processadores gr�ficos � possibilitado pelos m�ltiplos n�cleos e n�o apenas pela l�gica de organiza��o das instru��es e ocupa��o das unidades de processamento (pipeline).

Ambiente de testes

Para realiza��o dos testes foi utilizado um computador convencional com a seguinte configura��o: processador Intel Core 2 Quad Q6600 2.4 GHz, placa m�e Asus Maximus Formula, mem�ria Corsair de 4GB FSB 800 MHz DDR2, disco r�gido 500GB ...

Quer ler esse conteúdo completo? Tenha acesso completo