Performance .NET: Arrays em C#(csharp)

Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

Performance .NET: Arrays em C#

Bruno Silveira Cruz (e-mail) � Analista de Sistemas, instrutor certificado Microsoft, mais de 2 anos de experiencia lecionando cursos oficiais. Possui 6 anos de experi�ncia em infra-estrutura, e 4 em desenvolvimento, 2 com a pltaforma .NET e C#. Certficado MCP, MCSA 2000 e 2003, MCSA Exchange 2000, MCSE 2000, MCAD C# e MCT, mais de 15 exames de certifica��o no curr�culo.

Talvez o array seja um dos objetos mais comumente utilizados no ciclo de desenvolvimento de uma aplica��o. Vers�teis, de f�cil uso, eficientes e de certa forma baratos, do ponto de vista de desempenho, os arrays s�o utilizados para os mais diversos fins e das mais diversas maneiras.

No entanto, o que pode n�o ser muito claro para a maioria dos desenvolvedores, s�o os mecanismos internos de como a CLR manipula estas estruturas. A grande verdade � que arrays mal utilizados e manipulados podem corromper o desempenho de seu aplicativo, at� n�veis inaceit�veis.

Qualquer desenvolvedor que se preze preocupa-se, e muito, com o desempenho de seu aplicativo, e na melhor forma de otimiz�-lo. Benchmarking � a palavra de ordem aqui. Para demonstrar que o mais �til objeto pode se tornar um estorvo, preparei um aplicativo de console, que executa 5 testes simples envolvendo arrays.

Benchmarking

Os cinco testes propostos envolvem a utiliza��o de arrays da seguinte maneira: O objeto array � inicializado com um numero pr�-definido de elementos. O objeto � ent�o percorrido por um loop, sendo feito uma leitura e atribui��o de cada elemento a uma vari�vel criada. O download do aplicativo de teste pode ser feito aqui.

Note que os tempos obtidos podem variar um pouco, dependendo de seu hardware.

01. Value Type vs Reference Type

Teste:
O tipo de estrutura do array � muito importante. O array por si s� � um reference type. Isso �, ele � mantido no heap gerenciado e n�o no stack. Os value types s�o mais r�pidos do que os reference types, exatamente por isso. Value types s�o mantidos no stack e n�o no heap gerenciado, n�o sofrendo assim a degrada��o de desempenho do GC, nem do overhead de cria��o de objetos.

O teste proposto compara o desempenho de dois objetos array, um Int32 e um String, de 10.000 elementos cada, durante a execu��o e itera��o do loop. O array de Int32 � mais rapido correto? ERRADO. De uma olhada nos tempos obtidos no teste:

Resultado:

. Testando value type array:
Tempo de execu��o: 00:00:00.0066723 ms

. Testando reference type array:
Tempo de execu��o: 00:00:00.0049852 ms

Fato:

O array � um reference type. Quando voc� cria um array de um value type, como, por exemplo, Int32, dentro de um reference type como o array, o que acontece � que � guardada uma refer�ncia do objeto no heap, para uma estrutura no stack, o que reduz drasticamente o desempenho.

Conclus�o:

Value types s�o tipos chamados de lightweight objects. Eles n�o possuem o overhead dos reference types, portanto s�o mais r�pidos. Os value types tamb�m tem suas limita��es; n�o podem ser base para nenhum outro tipo, s�o sempre objetos distintos, n�o recebem notifica��es de libera��o de mem�ria (Finalize), e ainda por cima tem grandes problemas com rela��o a desempenho, se falarmos de Boxing/Unboxing. Mas no geral s�o mais r�pidos do que reference types.

No entanto, quando falamos de arrays, a diferen�a de desempenho � quase nula, porque o array em si � um reference type, anulando os benef�cios da cria��o da estrutura no stack.

02. Array Multidimensional vs Jagged Array

Teste:
Apesar do desempenho extremamente inferior, o CLR suporta o uso de arrays multidimensionais e jagged arrays. O resultado � praticamente id�ntico, assim como o desempenho. Dois arrays distintos com 10.000 elementos cada ser�o utilizados neste teste.

Resultado:

. Testando array multidimensional:
Tempo de execu��o: 00:00:02.4207101 ms

. Testando jagged array:
Tempo de execu��o: 00:00:02.0582227 ms

Fato:

O jagged array se mostrou mais r�pido do que o array multidimensional em quase 4 d�cimos de segundo! No entanto o fato apresentado aqui � uma verdade parcial. O tempo de acesso de um jagger array � menor, mas sua cria��o � mais demorada do que um array multidimensional, pois cada dimens�o de um jagged array necessita de um novo objeto alocado no heap.

Conclus�o:

Aqui temos uma faca de dois gumes. Enquanto o jagged array se mostrou superior nos tempos de acesso, � importante lembrar que sua cria��o � mais demorada do que um array multidimensional. Portanto, se seu aplicativo criar poucos objetos de array, mas acessa-os constantemente, o jagged array � a melhor solu��o. No entanto, se seu aplicativo criar arrays com freq��ncia, mas s� acessa poucas vezes, ent�o o array multidimensional � a melhor escolha.

03. Safe Access vs Unsafe Access

Teste:

O �ltimo teste proposto envolve o acesso aos elementos de um array recuperando-os diretamente do heap, usando c�digo n�o gerenciado. Foi comparado o tempo de acesso de arrays multidimensionais e jagged arrays com um array multidimensional acessado atrav�s de c�digo n�o gerenciado como mostrado abaixo.

System.Int32 lowbound0 = unsafemultidimensionalarray.GetLowerBound(0);
System.Int32 highbound0 = unsafemultidimensionalarray.GetUpperBound(0);
System.Int32 lowbound1 = unsafemultidimensionalarray.GetLowerBound(1);
System.Int32 highbound1 = unsafemultidimensionalarray.GetUpperBound(1);
System.Int32 elements = highbound0 - lowbound0;

Console.WriteLine("Testando array dimensional unsafe:");
timertotal = Stopwatch.StartNew();

unsafe
{
     fixed (System.Int32* pi = &unsafemultidimensionalarray[0, 0])
     {
         for (int x = lowbound0; x < highbound0; x++)
         {
             System.Int32 baseelement = x * elements;
             for (int i = lowbound1; i < highbound1; i++)
             {
                 System.Int32 el = pi[baseelement + i];
             }
         }
     }
}

Resultado:

. Testando array multidimensional:
Tempo de execu��o: 00:00:02.4207101 ms

. Testando jagged array:
Tempo de execu��o: 00:00:02.0582227 ms

. Testando array dimensional unsafe:
Tempo de execu��o: 00:00:00.6456633 ms

Fato:

Ok, claro que o array acessado atrav�s de c�digo n�o gerenciado seria mais r�pido. Mas notem que a diferen�a nos tempos de acesso � de quase 2 segundos! Isso se deve ao fato de que todo overhead de checagem e seguran�a que o c�digo gerenciado introduz n�o � executado.

Conclus�o:

A diferen�a de desempenho � ultrajante. O acesso utilizando c�digo n�o gerenciado se mostrou quase 2 segundos mais r�pido do que os m�todos de acesso tradicionais. No entanto, � interessante lembrar alguns fatos:

. O c�digo � menos leg�vel do que o c�digo gerenciado. Consequentemente, pode ser mais dif�cil e demorado realizar um debug no c�digo.

. A chance de erro � maior, visto que � necess�rio calcular manualmente os endere�os de memoria do array.

. Em caso de erro, como acessa um valor fora dos limites do objeto, nenhuma exce��o � gerada. Isso pode levar seu aplicativo a ter um comportamento imprevis�vel, causando corrup��o de estruturas, crash no aplicativo ou at� mesmo no SO. Al�m de que esse tipo de falha tende a abrir furos de seguran�a.

. Devido a estes pequenos detalhes, o CLR s� executar� c�digo marcado como unsafe se o administrador ou o usu�rio permitirem, e se a montagem tiver permiss�es para isso. Uma montagem instalada localmente tem essa permiss�o, mas uma montagem carregada pela intranet ou internet n�o. Ao tentar usar este recurso, o CLR lan�a uma exce��o imediatamente.

Finalizando

Existem um milh�o de maneiras diferentes de otimizar um aplicativo. O desempenho tem que ser encarado como uma meta, t�o importante como a funcionalidade do aplicativo. A partir do momento que mensurar o desempenho de seu aplicativo e otimiz�-lo, tornando um h�bito, ser� mais e mais f�cil conseguir resultados positivos, sem aumentar o tempo de desenvolvimento e, consequentemente, o custo de seu projeto.

As diferen�as de d�cimos de segundos podem parecer insignificantes. Mas imagine sua aplica��o real. Seu aplicativo possivelmente passar� por estas opera��es dezenas, centenas, at� milhares de vezes por dia. Nesse momento, a diferen�a de desempenho ir� transparecer.

Usar c�digo n�o gerenciado n�o � a resposta a todos os problemas de desempenho. Modera��o � a regra aqui. Para construir um sistema robusto, r�pido e auto-sustent�vel, � preciso encarar cada desafio, e implementar a solu��o mais adequada a cada situa��o.

At� a pr�xima.