Aten��o: esse artigo tem uma palestra complementar. Clique e assista!

Do que trata o artigo

O artigo descreve como � feita a altera��o de comportamento de classes da VCL em tempo de execu��o. A altera��o ser� feita atrav�s de substitui��o de c�digo diretamente nas p�ginas de mem�ria, durante a inicializa��o do aplicativo. Alterar o c�digo de partes compiladas da VCL obriga a posterior recompila��o de componentes de terceiros e partes da pr�pria VCL.

Para que serve

Esta t�cnica � utilizada para substituir fun��es que s�o executados com muita frequ�ncia e que se substitu�das por vers�es otimizadas, podem trazer uma grande melhoria no desempenho ou tempo de execu��o de aplicativos. Considera-se que n�o se pode alterar o c�digo por vias normais, por exemplo, estendendo a funcionalidade de uma classe atrav�s de heran�a.

Em que situa��o o tema � �til

Estas substitui��es de c�digo s�o frequentemente utilizadas pelos projetos DelphiSpeedUp e FastCode. Como eles substituem partes da RTL por c�digos otimizados, a fim de melhorar o tempo de execu��o da IDE, s�o obrigados a fazer as altera��es em mem�ria, j� que n�o podem modificar o c�digo fonte da IDE e VCL. As t�cnicas podem ser aplicadas no dia a dia para otimizar partes da VCL e estruturas de dados utilizadas nos aplicativos.

Resumo do DevMan

Este artigo mostra como se pode alterar o comportamento de um aplicativo em tempo de execu��o, substituindo partes de c�digo na mem�ria por outras, otimizadas. Esta t�cnica � usada pelos desenvolvedores do projeto FastCode, um projeto que tem a inten��o de reescrever v�rias fun��es da VCL do Delphi com o objetivo de torn�-las mais r�pidas. O projeto tem uma visibilidade tal que a pr�pria CodeGear/Embarcadero tem atualizado algumas de suas fun��es com base no que foi disponibilizado no projeto. Al�m disso, esta t�cnica tamb�m � utilizada por Andreas Hausladen em seus utilit�rios para Delphi. Um exemplo de uso da t�cnica � o utilit�rio DephiSpeedUp que substitui fun��es do Delphi e torna a IDE muito mais r�pida. Mais informa��es sobre o plug-in podem ser obtidas aqui: http://andy.jgknet.de/blog/?page_id=8

Desenvolver um framework como a VCL n�o � uma tarefa f�cil. Ter em mente todos os poss�veis usos que um desenvolvedor poder� fazer de uma quantidade imensa de classes n�o � t�o simples. Devido a estas dificuldades, muitas partes do c�digo n�o recebem a devida aten��o ou n�o s�o codificadas pensando em requisitos agressivos de desempenho. Muitas vezes voc� nem sabe que usa, mas estes c�digos est�o l� no seu execut�vel final, rodando no cliente e levando um tempo precioso para ser processado.

Al�m do mais, h� a quest�o do uso de conjuntos de instru��es dos processadores mais novos. Do que adianta comprar um processador com um conjunto de instru��es SSE3 se o compilador n�o gera execut�veis que fazem uso delas?

Nota do DevMan

As extens�es SSE3(Streaming SIMD Extensions 3) permitem um alargamento das capacidades SIMD disponibilizadas pelas extens�es SSE e SSE2. Permitem um aumento do desempenho no processamento de dados em diversas �reas como, por exemplo, a aritm�tica de n�meros complexos e na descodifica��o de v�deo. Mais informa��es em http://pt.wikipedia.org/wiki/SSE3

Mas existe um bom motivo para evitar o uso destes conjuntos de instru��es: O execut�vel tem que ser compat�vel com todos os processadores. Mas n�o teria uma forma de aproveitar tais instru��es quando dispon�veis?

Pensando nestes detalhes, o projeto FastCode cria rotinas substitutas para fun��es que s�o muito chamadas durante a execu��o do programa. Tais rotinas identificam as capacidades do processador da m�quina e substituem fun��es da RTL e VCL por vers�es otimizadas, adequadas ao processador em uso.

O interessante da abordagem que o projeto FastCode usa � que basta apenas incluir a unit com as otimiza��es no seu projeto. Nada de altera��es no c�digo de seu aplicativo para usufruir das otimiza��es. Mas como isso � feito? Como substituir fun��es da VCL sem alterar os pas/dcus da mesma? Ora, o compilador l� estes arquivos ao gerar o execut�vel, n�o � mesmo?

Esta substitui��o n�o � algo simples. De fato seria muito mais f�cil alterar o c�digo da unit da VCL diretamente. Mas isso implica em recompilar todas as depend�ncias da unit alterada, inclusive componentes de terceiros e at� mesmo partes da pr�pria VCL. O impacto da altera��o � grande e se espalha bastante, dependendo da unit alterada. J� recebeu a mensagem de erro na compila��o: �Unit x was compiled with a different version of y�?

Para entender o que � feito, voltemos � arquitetura de computadores que usamos: a arquitetura de Von Neuman. Nela, todo programa sai do dispositivo de armazenamento secund�rio (disco r�gido) e vai para a mem�ria principal para ser processado. E � aqui que mora o segredo: p�ginas de mem�ria podem ser alteradas.

Nota do DevMan

John von Neumann: � considerado um dos mais importantes matem�ticos do s�culo XX. Foi membro do Instituto de Estudos Avan�ados em Princeton, New Jersey, do qual tamb�m faziam parte Albert Einstein. A maioria dos computadores de hoje em dia segue ainda o modelo proposto por von Neumann. Esse modelo define um computador sequencial digital em que o processamento das informa��es � feito passo a passo, caracterizando um comportamento determin�stico (ou seja, os mesmos dados de entrada produzem sempre a mesma resposta).

Existem m�todos no sistema operacional que permitem a altera��o de partes da mem�ria enquanto o programa est� sendo executado. Isto � feito a todo o tempo, na �rea de dados do aplicativo, quando o valor de vari�veis � alterado, quando dados s�o carregados do banco de dados etc.

O c�digo compilado do aplicativo tamb�m vai para a mem�ria. � poss�vel alterar a �rea de mem�ria onde ele est�. Sim, � isso mesmo. Alterar os bits de c�digo diretamente na mem�ria RAM, ou seja, alterar o comportamento do aplicativo enquanto ele � executado. Modificar o c�digo que foi lido do disco r�gido. Obviamente existem restri��es. J� pensou se qualquer aplicativo pudesse alterar o c�digo de outro em execu��o? Seria um prato cheio para desenvolvedores de v�rus.

Em nosso caso o pr�prio aplicativo se alterar�, quando iniciar sua execu��o. Do contr�rio, receber�amos um Access Violation. Faz mais sentido agora o que � um Access Violation? � uma simples tentativa de acessar ou alterar mem�ria que n�o te pertence!

Resumindo, o que � feito � uma altera��o nas p�ginas de mem�ria que o execut�vel ocupa, logo ap�s ele ser carregado na mem�ria. Desta forma, o execut�vel que est� no disco r�gido ser� diferente do execut�vel sendo executado na mem�ria RAM.

Neste artigo ser� exemplificado como se pode fazer tais substitui��es, otimizando o m�todo FindField da classe TFields. Este m�todo � lento porque faz um la�o varrendo todos os campos do TDataSet � procura de determinado campo. � o m�todo chamado quando se executa TDataSet.FieldByName('NOME') por exemplo.

N�o se engane pensando que, porque voc� n�o usa este m�todo nos seus fontes, ele n�o � usado no seu aplicativo. Na verdade a pr�pria VCL faz uso extensivo deste m�todo, pois precisa ligar os seus pr�prios componentes aos TFields do DataSet. Isso inclui TDBEdits, TDBGrids, geradores de relat�rios e qualquer outro componente que faz uso de qualquer classe descendente de TDataSet.

Analisando a complexidade do m�todo FindField

Como dito na introdu��o, o algoritmo FindField � lento porque ele simplesmente varre todos os campos do DataSet, em ordem de �ndice, at� encontrar o campo procurado. Isso � feito porque o campo � procurado atrav�s de seu nome.

Observando o c�digo da Listagem 1, podemos fazer a seguinte an�lise de complexidade, a respeito do algoritmo FindField. Observe que a entrada do algoritmo � a lista de campos do DataSet, com n entradas/campos:

� No melhor caso � Ω(1). O campo procurado � o primeiro da lista. O la�o for da linha 5 ser� executado apenas uma vez e o exit da linha 8 ser� ent�o chamado.

� No caso m�dio � Θ se todos os campos forem consultados a cada itera��o.

� No pior caso � O(n). O campo procurado � o �ltimo ou n�o existe. O nome do campo foi comparado com todos os outros.

Nota do DevMan

Os termos melhor caso, caso m�dio e pior caso, representados pelos s�mbolos Ω, Θ e O respectivamente, vem da disciplina Complexidade de Algoritmos. Dizem respeito ao tempo que um algoritmo leva para concluir seu processamento, em rela��o ao tamanho da entrada que lhe � dada. Neste exemplo a entrada � a lista de todos os campos. O(n) quer dizer que todos os campos da lista (n campos) ser�o consultados para se chegar � resposta do processamento. Complexidades comuns na literatura s�o O(n lg n) e O(n�) para algoritmos de ordena��o de listas, O(n�) para busca de caminhos m�nimos em grafos, dentre outros. Esta disciplina � estudada geralmente em cursos na �rea de computa��o.

Listagem 1. C�digo do m�todo FindField da VCL


   1. function TFields.FindField(const FieldName: string): TField;
   2. var
   3.   I: Integer;
   4. begin
   5.   for I := 0 to FList.Count - 1 do
   6.   begin
   7.     Result := FList.Items[I];
   8.     if WideCompareText(Result.FFieldName, FieldName) = 0 then Exit;
   9.   end;
  10.   Result := nil;
  11. end;

Existem pelos menos duas formas de se otimizar este c�digo: Atrav�s de uma lista ordenada ou uma lista Hash. Com uma lista ordenada conseguir�amos um tempo O(lg n) sempre, indiferente se o campo est� no come�o ou final da lista. Esta abordagem introduz um overhead devido � necessidade de ordena��o desta lista. Poder�amos realizar esta ordena��o em tempo Θ(n lg n), utilizando o algoritmo quicksort por exemplo. A ordena��o deveria ser executada uma vez a cada abertura do DataSet. Escrevi um artigo sobre este m�todo no meu blog pessoal, no artigo �FieldByName � O(n), que tal melhor�-lo para O(Lg n)?� que est� dispon�vel em www.thborges.com/?p=36.

Irei um pouco al�m agora. Explicarei como otimizar o m�todo FindField utilizando uma tabela Hash. Esta abordagem garante um tempo constante de praticamente O(1), indiferente da posi��o que o campo ocupa no DataSet. � como se a fun��o sempre soubesse onde est� o campo na lista, olhando apenas para seu nome.

O que � uma tabela Hash?

Uma tabela Hash � uma estrutura de dados que armazena um conjunto de itens em um array, utilizando uma fun��o de espalhamento para determinar o �ndice onde cada item ser� armazenado. A fun��o de espalhamento, ou fun��o hash, opera sobre o conjunto de itens, convertendo cada um deles em um n�mero inteiro. Este n�mero inteiro � utilizado como �ndice no array onde o item ser� armazenado.

Diz-se que esta fun��o � perfeita se a mesma consegue atribuir a cada item da lista um n�mero �nico, sem repeti��es. E pode ainda ser m�nima se faz este mapeamento utilizando a menor quantidade de �ndices poss�veis, sem repetir. Observe na Figura 1 que cada nome foi mapeado em um �ndice do vetor, mas sobraram posi��es no vetor. Esta fun��o � dita perfeita, mas n�o m�nima. Ao contr�rio, na Figura 2, observe que n�o h� posi��es n�o utilizadas no vetor, portanto a fun��o � m�nima.

Figura 1. Fun��o hash perfeita (fonte: Wikipedia)

Figura 2. Fun��o hash m�nima (fonte: Wikipedia)

Na pr�tica, fun��es hash m�nimas e perfeitas s�o dif�ceis de obter. Em geral a fun��o retorna �ndices repetidos para itens distintos. Por esse motivo, em cada posi��o do array � armazenado n�o somente um, mas v�rios itens. De forma que, quanto mais �ndices repetidos a fun��o retornar, pior ser� a estrutura de dados em rela��o ao tempo de busca de um determinado item. Mas como uma tabela hash pode melhorar o tempo de busca de itens em uma lista? No nosso caso temos campos nomeados, cujos nomes n�o podem se repetir para uma determinada tabela. Durante o processo de inser��o dos campos no DataSet iremos executar uma fun��o hash que opera sobre strings, passando como par�metro o nome do campo. A fun��o ir� retornar um n�mero inteiro. Digamos que para o campo de nome CODCLIENTE a fun��o retorne 10. Incluiremos ent�o o campo na posi��o 10 de um array. Faremos isso para todos os campos. Quando o m�todo FindField for executado, pegaremos seu par�metro (o nome do campo procurado) e chamaremos a fun��o hash. Esta devolver� exatamente o �ndice do array (10) no qual o campo foi armazenado.

H� uma particularidade neste m�todo. As formas mais simples de tabelas hash exigem que a quantidade de posi��es no array seja previamente conhecida. Os limites da fun��o hash v�o, por exemplo, de 0 a 64. Isso quer dizer que a fun��o nunca ir� retornar um n�mero maior que 64, independente da string passada como par�metro. Para os campos de um DataSet isso pode ser um exagero, visto que geralmente n�o se tem uma tabela com tantos campos. O ideal � que se identifique um valor que cause a menor quantidade de repeti��es de �ndices poss�vel. Se a fun��o hash fosse perfeita e m�nima, este valor seria a quantidade de campos no DataSet.

Para nosso prop�sito utilizaremos a fun��o hash codificada pelo projeto DelphiSpeedUp. A fun��o hash, apesar de simples, foi codificada utilizando a linguagem assembly. O c�digo assembly da fun��o est� na Listagem 2. Nas linhas 5 a 7 calcula-se o tamanho da string. A seguir nas linhas 10 a 26 existe um loop percorrendo os caracteres da string. Observe que o @@ indica um label e a instru��o jnz � como um goto que volta para este label, enquanto n�o chegar ao fim da string. Na primeira etapa, linhas de 11 a 17, � feita uma opera��o que desconsidera letras mai�sculas e min�sculas. Observando a ordem dos caracteres na tabela ASCII, subtrair 'a' - 'A' de um caractere min�sculo, corresponde a transform�-lo em uma letra mai�scula. Nas linhas 20 a 23 � feito o c�lculo do hash, somando o ordinal de cada caractere ao resultado. Por fim na linha 28 faz-se a opera��o de m�dulo 64, que � o resto da divis�o do n�mero encontrado por 64. Note que o resto desta divis�o nunca � maior que 63 e isto garante que todos os campos ser�o armazenados em 64 posi��es de um array.

Nota do DevMan

Cada caractere na tabela ASCII � representado por um n�mero. Inicialmente foram definidos 128 caracteres, de 0 a 127, e incluem caracteres de controle (quebra de linha, retorno de carro, al�m de outros) e caracteres que possuem representa��o gr�fica (as letras, n�meros e s�mbolos). Quando se subtrai uma letra por outra, obt�m-se um n�mero. No caso da fun��o HashUpString, subtrair 'A' � 'a' � o mesmo que subtrair 97 � 65 = 32. Desta forma, subtrair 32 de uma letra min�scula qualquer a transforma em uma letra mai�scula. Por exemplo, a letra 't' (116) � 32 = 'T' (84).

Listagem 2. Fun��o HashupString do projeto DelphiSpeedUp


 1. function HashUpString(const AItem: string): Integer;
 2. asm
 3.  or eax, eax
 4.  jz @@Leave
 5. 
 6.  xchg eax, edx
 7.  mov eax, [edx-$04] // Length(AItem)
 8.  xor ecx, ecx
 9. 
10. @@HashStringNextChar:
11.  mov cl, [edx]
12. 
13.  cmp cl, 'a'
14.  jb  @@UpCaseEnd
15.  cmp cl, 'z'
16.  ja  @@UpCaseEnd
17.  sub cl, 'a' - 'A'
18. @@UpCaseEnd:
19. 
20.  ror cl, 4
21.  shl cx, 1
22.  add eax, ecx
23.  xor ch, ch
24.  inc edx
25.  or ecx, ecx
26.  jnz @@HashStringNextChar
27. 
28.  and eax, 64-1
29. @@Leave:
30. end;

Passo a passo da altera��o na classe TFields

A otimiza��o do m�todo FindField ser� feita em quatro passos, como descrito a seguir:

1. Cria-se uma nova unit, onde ser�o declaradas as classes auxiliares e executados os m�todos de substitui��o na se��o initialization. Chamaremos de FieldOptimize.pas;

2. Cria-se a classe TNameHashListque ser� a lista hash, descendente de TList. Ser� usada para substituir a lista de campos da classe TFields (veja detalhes a seguir);

3. Cria-se uma c�pia parcial da classe TFields, para poder acessar seus campos privados atrav�s de um typecast for�ado. Chamaremos de TPrivateFields;

4. Cria-se a classe TFastFieldsque conter� apenas o m�todo FindField otimizado.

A classe TNameHashList

A classe TNameHashList � uma varia��o da classe de mesmo nome do projeto FastCode, mais precisamente da unit RtlVCLOptimize.pas. � necess�ria apenas uma adapta��o para que ela opere com TFields.O ponto mais importante da constru��o � a reescrita do m�todo Notify. Este m�todo � invocado pela TList sempre que um item � adicionado ou removido da lista. Assim, sempre que isso acontecer estaremos alimentando um vetor adicional, que � o hash em si.

Tr�s m�todos s�o necess�rios: NameAdd, NameRemove e NameFind. Estes m�todos ser�o chamados para adicionar, remover e procurar um item na lista hash, respectivamente.

Observe na Listagem 3 o m�todo NameAdd. Na linha 8 � chamado o m�todo HashupString (descrito na Listagem 2) armazenando seu retorno em AHash. AHash representa o �ndice onde o TField deve ser inserido. Pode ter ocorrido uma colis�o de �ndices e a posi��o AHash j� est� sendo usada por outra entrada. Salva-se ent�o, Linha 9, o conte�do corrente da posi��o AHash no campo Next de uma nova estrutura N do tipo NameCompItem, formando uma lista ligada (veja Nota do DevMan). A seguir, linhas 10 a 13, a posi��o AHash do array � substitu�da pela nova entrada e o par Key/Value da estrutura N � preenchido com o nome do campo e sua inst�ncia, respectivamente.

Nota do DevMan

Observe que a lista ligada � necess�ria devido a possibilidade de colis�es, conforme pode ser observado na Figura 3. Veja que Sandra Dee e John Smith est�o posicionados no �ndice 152 do array. � neste detalhe que est� a velocidade ou lentid�o de uma lista hash. Se esta lista ligada ficar muito longa, ou seja, ocorrerem muitas colis�es, o processo de busca ficar� lento.

Figura 3. Tabela Hash com colis�o na posi��o 152. Observe que John Smith est� na mesma posi��o que Sandra Dee (fonte: Wikipedia)

Listagem 3. Fun��o NameAdd da classe TNameHashList


  1.  function TNameHashList.NameAdd(const AItem: string; 
  2.    AData: TField): TField;
  3.  var
  4.    N: PNameCompItem;
  5.    AHash: Integer;
  6.  begin
  7.    New(N);
  8.    AHash := HashUpString(AItem);
  9.    N.Next := FItems[AHash];
  10.   FItems[AHash] := N;
  11.   Inc(FNameCount);
  12.   N.Key := AItem;
  13.   N.Value := AData;
  14.   Result := AData;
  15. end;

O que a fun��o NameRemove faz � remover um item da lista hash. Inicialmente chama-se HashupString com o nome do campo que ser� removido. Como na inser��o tamb�m foi utilizada esta fun��o para escolher em que �ndice o campo seria inserido, o mesmo s� pode estar na lista ligada da posi��o retornada, digamos que seja a posi��o P. Procura-se ent�o na lista ligada do �ndice P pelo respectivo campo. O campo pode estar no in�cio, meio ou fim da lista, portanto ao remover � necess�rio manter os links entre os itens corretamente, cada um apontando sempre para o seguinte. O c�digo foi omitido para evitar polui��o do texto, mas est� dispon�vel no download do artigo.

Por fim, a fun��o NameFind, Listagem 4, � respons�vel por encontrar um campo na lista hash. Encontra-se a posi��o AHash no array, onde o campo pode ter sido armazenado, utilizando o nome do campo procurado, Linha 8. A lista ligada desta posi��o � ent�o percorrida, Linhas 10 a 19, at� que se encontre um campo com o nome procurado. Caso o campo n�o exista, a lista ser� percorrida item a item.

Observe que existe uma situa��o de pior caso, onde todos os campos est�o armazenados na mesma posi��o do array, tornando a lista muito grande. A procura neste caso seria t�o ruim quanto a do m�todo original. Por�m, no caso de TFields, esta lista tende a n�o ser muito grande devido os nomes dos campos serem sempre diferentes uns dos outros. Fica evidente aqui tamb�m a import�ncia de escolher um tamanho adequado para o array da lista hash.

Listagem 4. Declara��o parcial da classe TFields na unit DB.pas


  1. function TNameHashList.NameFind(const AItem: string; 
  2.   out Value: TField): Boolean;
  3. var
  4.   N: PNameCompItem;
  5.   AHash: Integer;
  6. begin
  7.   Value := nil;
  8.   AHash := HashUpString(AItem);
  9.   N := FItems[AHash];
  10.   while N <> nil do
  11.   begin
  12.     if CompareText(N.Key, AItem) = 0 then
  13.     begin
  14.       Value := N.Value;
  15.       Result := True;
  16.       Exit;
  17.     end;
  18.     N := N.Next;
  19.   end;
  20.   Result := False;
  21. end;

As classes TPrivateFields e TFastFields

Fazendo uma analogia, ser� necess�rio fazer uma �cirurgia� na classe TFields, em tempo de execu��o. Fazer um transplante de sua lista de campos FList, digamos o seu cora��o, e conectar algumas art�rias (m�todo FindField) a outros locais. Por�m, o campo FList da classe TFields � privado. Precisaremos utilizar um typecast um pouco for�ado para conseguir acess�-lo, destru�-lo, e substituir por uma inst�ncia de TNameHashList.

A ci�ncia est� por tr�s do typecast. Ensinaram-te que o typecast "transforma" uma classe em outra, certo? Mas al�m do b�sico, o que est� acontecendo � apenas uma manipula��o de endere�os de mem�ria. � voc� dizendo ao compilador: "Acesse os campos deste objeto como se ele fosse este outro". E ent�o o compilador come�a a gerar o execut�vel escrevendo: O primeiro campo do objeto est� na posi��o onde o objeto est� instanciado + 4 bytes, o segundo na posi��o inicial + 8 bytes e por a� vai. Tudo se resume a endere�os de mem�ria e intervalos.

Declara-se ent�o uma nova classe TPrivateFields, id�ntica ao in�cio de TFields. Descendendo da mesma classe (TObject) que a TFields, declarando os campos da se��o private at� chegar no desejado. Todos os campos declarados t�m que estar na mesma ordem e posi��o.

Desta forma, como todos os campos est�o na mesma ordem, e portanto com os mesmos intervalos de endere�os de mem�ria do objeto original, podemos acessar qualquer campo privado do objeto como se fosse o nosso pr�prio. Mas aten��o, os desenvolvedores da VCL podem mudar esta ordem de uma vers�o para outra, fique atento.

Na Listagem 5 est� a declara��o da classe TPrivateFields. Note que o FList � o primeiro campo da se��o private, e por isso ela ficou bem simples. O segredo maior est� na classe TFastFields. Ela existe apenas para conter a fun��o FindField. Sequer ser� instanciada durante toda a execu��o do projeto. Nela declaramos FindField com a mesma assinatura da TFields.FindField, Linhas 8 a 11. A implementa��o deste m�todo consiste em testar se a FList j� � uma inst�ncia de TNameHashList e, caso contr�rio, substitu�-la. Para isso, faz-se o typecast para acessar o campo privado FList, Linha 20. Caso n�o seja (Linhas 22 a 28), instancia-se uma nova TNameHashList (Linha 22) copia-se os campos porventura j� existentes na lista original (Linhas 24 a 26), substitui-se a lista antiga pela nova TNameHashList, Linha 27) e por fim destr�i-se a lista antiga, Linha 28. Mas aten��o, essa substitui��o s� funciona porque a TNameHashList tamb�m � descendente de TList. Note que todo o c�digo da classe TFields continua acessando o campo privado FList como se nada tivesse acontecido.

N�o ocorre vazamento de mem�ria porque a pr�pria classe TFields se encarregar� de destruir a tabela hash. Na verdade ela ir� destruir o conte�do da vari�vel FList, achando que l� existe uma TList comum, mas sabemos que isso n�o � verdade porque a substitu�mos. Por�m como o m�todo Free � herdado de TObject, n�o haver� nenhum problema.

Listagem 5. C�digo das classes TPrivateFields e TFastFields


  1. type
  2.
  3.   TPrivateFields = class(TObject)
  4.   private
  5.     FList: TList;
  6.   end;
  7.
  8.   TFasTFields = class(TFields)
  9.   public
  10.    function FindField(const FieldName: WideString): TField;
  11.  end;
  12.
  13. { TFastFields }
  14.
  15. function TFastFields.FindField(const FieldName: WideString): TField;
  16. var
  17.   List, HashList: TList;
  18.   I: Integer;
  19. begin
  20.   if not (TPrivateFields(Self).FList is TNameHashList) then
  21.   begin
  22.     HashList := TNameHashList.Create;
  23.     List := TPrivateFields(Self).FList;
  24.     HashList.Capacity := List.Capacity;
  25.     for I := 0 to List.Count - 1 do
  26.       HashList.Add(List.List[I]); // copy and hash
  27.     TPrivateFields(Self).FList := HashList;
  28.     List.Free;
  29.   end;
  30.
  31.   TNameHashList(TPrivateFields(Self).FList).NameFind(FieldName, Result);
  32. end;

A m�gica da substitui��o de c�digo com JMP ($E9)

Na mem�ria RAM do computador h� uma quantidade enorme de n�meros que possuem os mais diversos significados. Existem n�meros que representam dados, como letras e n�meros, e n�meros que representam opera��es que o computador deve fazer. � o chamado conjunto de instru��es do computador, como por exemplo SSE2 ou SSE3.

H� um conjunto padr�o destas instru��es, v�lidos para a maioria dos processadores. Estas opera��es incluem soma, subtra��o, redirecionamentos e muitos outros. O que nos importa aqui � o redirecionamento, ou se preferir, o goto. Ele � representado pelo n�mero hexadecimal $E9, instru��o assembly JMP, que significa fazer um salto, jump, para um endere�o de mem�ria e continuar o processamento deste endere�o em diante. Note que existem v�rios tipos de jumps. H� jumps que s� saltam se determinada condi��o for atendida, se o n�mero for maior, igual, menor que outro, por exemplo. Este que usaremos � o incondicional.

A substitui��o de uma fun��o por outra � feita escrevendo no in�cio da fun��o FindField original um goto para o endere�o da nova fun��o. A fun��o original � referenciada em muitos locais na mem�ria, mas sempre que o processador chegar no endere�o dela ser� for�ado a ir para outro endere�o: o endere�o da nova fun��o.

Observe na Listagem 6 a fun��o CodeRedirect, extra�da do projeto DelphiSpeedUp. A fun��o recebe o endere�o de dois m�todos como par�metros, Proc e NewProc. Primeiro captura-se o endere�o na mem�ria onde o procedimento original est�. Para isso utiliza-se a fun��o GetActualAddr, Linha 7. A seguir, linhas 8 e 9, � solicitado ao sistema operacional que permita a escrita na p�gina onde a fun��o est� localizada (Fun��o VirtualProtectEx, com par�metro PAGE_EXECUTE_READWRITE). Na linha 11 e 12 � ent�o feito o redirecionamento, utilizando o record TInjectRec. Este record serve para injetar o c�digo assembly de salto. No primeiro byte grava-se a opera��o (jump) e nos quatro bytes seguintes a quantidade de bytes a saltar, a partir do endere�o atual. Por fim volta-se a p�gina de mem�ria para o estado anterior, provavelmente read-only, e executa-se um flush para descarregar a p�gina dos registradores, evitando problemas com m�quinas de v�rios n�cleos, linhas 14 a 16.

Listagem 6. Fun��o CodeRedirect do projeto DelphiSpeedUp


   1. procedure CodeRedirect(Proc: Pointer; NewProc: Pointer);
  2. var
  3.   OldProtect: Cardinal;
  4. begin
  5.   if Proc = nil then
  6.     Exit;
  7.   Proc := GetActualAddr(Proc);
  8.   if VirtualProtectEx(GetCurrentProcess, Proc, SizeOf(TInjectRec), 
   9.     PAGE_EXECUTE_READWRITE, OldProtect) then
 10.   begin
 11.     TInjectRec(Proc^).Jump := $E9;
 12.     TInjectRec(Proc^).Offset := Integer(NewProc) - (Integer(Proc) +
  13.       SizeOf(TInjectRec));
 14.     VirtualProtectEx(GetCurrentProcess, Proc, SizeOf(TInjectRec),
  15.       OldProtect, @OldProtect);
 16.     FlushInstructionCache(GetCurrentProcess, Proc, SizeOf(TInjectRec));
 17.   end;
 18. end;

Colocando a cereja no bolo

Por fim e o mais importante de tudo: o redirecionamento da fun��o FindField da classe TFields para a classe TFastFields. Observe a Listagem 7. Basta fazer uma chamada � fun��o CodeRedirect, passando como par�metro o endere�o do m�todo origem e destino.

Listagem 7. Redirecionamento de TFields.FindField para TFastFields.FindField


  1. initialization
  2.   CodeRedirect(@TFields.FindField, @TFastFields.FindField);

O que acontecer� quando o aplicativo iniciar?

1. O c�digo da se��o initialization ser� invocado. Ele alterar� a p�gina de mem�ria onde foi colocado o m�todo TFields.FindField, for�ando o processador a saltar para o endere�o onde o m�todo TFastFields.FindField foi escrito na mem�ria, sempre que a primeira fun��o for chamada;

2. A fun��o TFields.FindField � chamada em qualquer local do aplicativo e o processador salta para a TFastFields.FindFind;

3. A nova fun��o FindField testa se a FList ainda � uma inst�ncia de TList. Como � a primeira chamada ela trocar� a TList por uma TNameHashList;

4. Os campos s�o adicionados na lista hash � medida que v�o sendo inseridos, atrav�s do m�todo Notify reescrito;

5. O campo � posteriormente procurado na TNameHashList e retornado como se o nosso transplante n�o tivesse acontecido. Por�m, agora a complexidade da busca � O(1), desconsiderando as colis�es no hash.

Conclus�o

Este tipo de interven��o em tempo de execu��o � uma forma avan�ada de corrigir ou melhorar c�digos de bibliotecas, muito utilizado pelos projetos FastCode e na maioria das melhorias feitas por Andreas Hausladen (andy.jgknet.de/blog), dentre elas o projeto DelphiSpeedUp.

Uma das melhorias introduzidas por tal projeto � exatamente colocar uma lista hash para ser utilizada nas chamadas do m�todo FindComponent. Boa parte da otimiza��o � essa. O FindComponent da VCL � feito da mesma forma que o FindField. Existe uma lista de componentes que � preenchida sempre que objetos descendentes de TComponent s�o criados. Ao procurar por um componente esta lista � varrida item a item, comparando os nomes dos componentes at� encontrar o desejado.

A melhora com a otimiza��o da fun��o FindField pode ser percebida principalmente no tempo de carregamento das telas, onde acontece a maioria das chamadas a esta fun��o, vinculando os TDBEdits e correlatos aos campos nos DataSets. Nos DataModules, quando se usa campos persistidos, ocorre uma vincula��o entre todos os TFields logo em sua abertura. O mesmo acontece quando se abre os TDataSets. Outra situa��o onde ocorre melhora � quando se usa o m�todo FieldByName em rotinas que processam grandes quantidades de registros.

O uso de listas hash pode ser expandido a qualquer situa��o onde seja necess�rio localizar objetos atrav�s de seus nomes. O �nico detalhe a observar � o tamanho do array do hash, onde ser�o colocados os itens. � necess�rio ter uma ideia da quantidade de itens que ser�o utilizados. � importante considerar tamb�m o qu�o bem a fun��o hash espalha os itens nas posi��es deste array. Dependendo da rotina, uma boa ideia � deixar esta configura��o como par�metro do sistema.

Para quem utiliza vers�es mais atuais do Delphi, outro ponto poss�vel � a utiliza��o de generics para constru��o de uma lista hash que possa ser utilizada com qualquer objeto que possua um campo representando seu nome.

Outras otimiza��es na VCL ou em componentes de terceiros podem ser feitas. Por�m, encontr�-las e saber como otimizar � uma tarefa um pouco mais complicada. Depende da experi�ncia e conhecimento de cada pessoa. Mas a forma de corrigir sem alterar fontes � esta.

Tecnologias:

Confira outros conte�dos:

Instalando o ACBr

Mapeamento Objeto-Relacional com TMS...

Introdu��o aos componentes JEDI

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Thiago Em 2009

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Marlon Nardi

N�vel 0

Gostei muito da materia, realmente muito util e com qualidade...

Parabens.

há +1 ano

Wesley Bobato

N�vel 0

Parabens Pelo Material!!!! Muito Interessante Show!!! Mesmo!!! Esperamos Poder Contar Cada Vez mais com Esses Materiais de Boa Qualidade um Bom Dia a Todos!!!

há +1 ano

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Artigo Clube Delphi 110 - Otimizando fun��es da VCL

O artigo descreve como � feita a altera��o de comportamento de classes da VCL em tempo de execu��o.

Aten��o: esse artigo tem uma palestra complementar. Clique e assista!

Confira outros conte�dos:

Instalando o ACBr

Mapeamento Objeto-Relacional com TMS...

Introdu��o aos componentes JEDI

Perguntas frequentes

Nossos casos de sucesso