Windows Portable Executable

Windows Portable Executable

Conhecendo por dentro nossos programas

Este artigo descreve o formato Portable Executable (PE), formato padr�o para arquivos objetos (bpl, dpl, cpl, ocx, etc.) e execut�veis (exe, dll, sys, scr, etc.) da plataforma Microsoft Windows, demonstrando suas se��es, analisando sua estrutura e funcionamento.

Introdu��o

Este artigo descrever� o formato Windows Portable Executable (PE), formato muito comum tratando de formatos de arquivos execut�veis e arquivos-objeto na plataforma Microsoft Windows.

O formato PE � basicamente uma estrutura padr�o de armazenamento de dados de arquivos onde est�o encapsuladas todas as informa��es necess�rias (c�digo, dados inicializados, dados n�o inicializados, etc.) ao sistema operacional (system loader) para sua leitura e execu��o.

Costumeiramente pouco estudado por desenvolvedores, devido at� pela n�o obrigatoriedade de conhecimento espec�fico e aprofundado no desenvolvimento de aplicativos, este assunto dificilmente � t�pico de discuss�o ou debate na comunidade, por�m este estudo e an�lise pode agregar em muito �queles que buscam conhecer o mecanismo interno a fins de otimiza��o, conhecimento em geral e, principalmente, prote��o de software.

No caso de prote��o de software, � de extrema import�ncia seu conhecimento, pois � nele que se encontram as informa��es b�sicas e fundamentais para funcionamento de um programa. Assim, � preciso conhec�-lo detalhada e aprofundadamente a fim de criar m�todos, armadilhas e bloqueios para preven��o de descarregadores de mem�ria (memory dumpers), debuggers e outros tipos de utens�lios e ferramentas de cracking[1].

Hist�ria

O formato Portable Executable foi desenvolvido pela Microsoft e padronizado em 1993 pelo Comit� de Padr�es de Interfaces de Ferramentas (Tool Interface Standard Committee), formado pela Microsoft, Intel, Borland, Watcom, IBM, entre outras.

O modelo PE foi desenvolvido com base no modelo COOF[2], isto porque a maioria de seus criados foram os mesmos que desenvolveram e codificaram o COOF. Com isso aproveitaram muito do c�digo deste modelo, j� que o mesmo funcionava muito bem e j� havia sido testado exaustivamente. Sendo assim, seria apenas necess�rio fazer as adapta��es necess�rias e exigidas pelas novas plataformas que usufru�rem deste formato.

O nome Portable � devido realmente a sua portabilidade, que possibilita sua implementa��o em diversas plataformas (x86, MIPS�, Alpha, entre outros) sem que sejam necess�rias altera��es em seu formato. � l�gico que diversas altera��es (como codifica��o bin�ria de instru��es de CPU, etc.) s�o necess�rias para funcionamento nestas plataformas, por�m o detalhe interessante � que n�o foi necess�rio reescrever do zero carregadores de sistemas para mem�ria (system loader) do sistema operacional e outras ferramentas para desenvolvimento.

Formato Portable Executable

O formato PE possui as seguintes estruturas de dados: cabe�alho MZ DOS, fragmento (stub) DOS, cabe�alho de arquivo PE, cabe�alho de imagem opcional, tabela de se��es (que possui uma lista de cabe�alhos de se��o), diret�rios de dados (que cont�m os ponteiros para as se��es) e ultimamente as se��es propriamente ditas, conforme Figura 1.

Figura 1. Estrutura do formato PE

Os arquivos PE, quando carregados na mem�ria, s�o bastante similares aos arquivos no disco. Com isto, o carregador (system loader) pode executar essa opera��o mais rapidamente, apenas tendo que mapear os endere�os do arquivo para endere�os de mem�ria.

Agora ser� analisado os dados de cada se��o existente num arquivo PE.

Cabe�alho DOS

Os primeiros bytes de qualquer arquivo PE constituem o cabe�alho DOS. � assim com todo e qualquer arquivo execut�vel ou arquivo-objeto PE. Al�m disso, os primeiros dois bytes deste cabe�alho ser�o a assinatura deste formato, sempre formada pelos bytes �MZ� (4D 5A em hexadecimal), ou seja, para um arquivo ser do formato PE, o mesmo deve obrigatoriamente come�ar por essa seq��ncia.

O cabe�alho DOS � constitu�do de 64 bytes, dispostos da seguinte maneira:

1. Assinatura �MZ� (2 bytes)

2. Tamanho da �ltima p�gina (2 bytes)

3. Total de p�ginas (2 bytes)

4. Itens de reloca��o (2 bytes)

5. Tamanho do cabe�alho DOS (2 bytes) � Estes bytes indicam o quantidade seq��ncias de 16 bytes (0F em hexadecimal) contidas no cabe�alho, ou seja, para determinar o tamanho do cabe�alho basta multiplicar o valor encontrado neste campo por 16

6. Tamanho m�nimo da mem�ria (2 bytes) � sempre encontrado �00 00� em hexadecimal

7. Tamanho m�ximo da mem�ria (2 bytes) � sempre encontrado �FF FF� em hexadecimal

8. Valor inicial do registrador SS (Stack Segment) (2 bytes)

9. Valor inicial do registrador SP (Stack Pointer) (2 bytes)

10. Checksum do cabe�alho DOS (2 bytes)

11. Valor inicial do registrador IP (Instruction Pointer) (2 bytes)

12. Valor inicial do registrador CS (Code Segment) (2 bytes)

13. Offset do fragmento (stub) DOS (2 bytes)

14. Overlay (2 bytes)

15. Identificador OEM (2 bytes)

16. Informa��es OEM (2 bytes)

17. Bytes reservados (24 bytes)

18. Betov's CheckSum (4 bytes)

19. Offset do cabe�alho de arquivo PE (4 bytes)

Para melhor exemplicar, ser� usado, como base de dados para as figuras, o arquivo notepad.exe do Windows XP SP 2.

Figura 2. Cabe�alho DOS

Fragmento (Stub) do DOS

Como detalhado anteriormente no cabe�alho DOS, � encontrado no offset 0x18 (item 13) o fragmento (stub) do DOS.

Este fragmento na verdade � um execut�vel embutido no cabe�alho PE, que � chamado caso o arquivo PE n�o possa ser executado.

Consiste num n�mero muito pequeno de bytes (at� por que o tamanho padr�o do fragmento DOS � de 64 bytes), divididos em instru��es de m�quina e num texto. Assim, ao carregar o programa na mem�ria, verifica o sistema � compat�vel, e caso n�o for, utiliza esta se��o para exibir a mensagem de erro.

Cabe�alho do Arquivo

Como detalhado anteriormente no cabe�alho DOS, � encontrado no offset 0x3C (item 19) o cabe�alho do arquivo.

Os componentes do cabe�alho do arquivo s�o os seguintes:

1. Assinatura do cabe�alho PE (4 bytes) � sempre encontrado a seq��ncia �PE00� (�50 45 00 00� em hexadecimal)

2. Tipo de m�quina previsto para rodar o execut�vel (2 bytes)

3. N�mero de se��es ap�s o cabe�alho (2 bytes)

4. Carimbo TimeDateStamp - Data e hora de cria��o do arquivo (4 bytes)

5. Ponteiro para Tabela de S�mbolos (4 bytes)

6. N�mero de S�mbolos (4 bytes)

7. Tamanho do Cabe�alho Opcional (2 bytes)

8. Caracter�sticas do arquivo (definidas por bit flags) (2 bytes)

Figura 3. Cabe�alho do arquivo

Cabe�alho Opcional

Imediatamente ap�s o cabe�alho do arquivo vem o cabe�alho opcional que, apesar do nome, est� sempre presente. � que o COOF utiliza um cabe�alho para bibliotecas, mas n�o para objetos, que � chamado de opcional. Este cabe�alho indica mais alguns detalhes de como o bin�rio deve ser carregado: o endere�o inicial, a quantidade reservada para a pilha (stack), o tamanho do segmento de dados etc. Este cabe�alho cont�m informa��es de como o arquivo PE deve ser tratado.

Os componentes do cabe�alho opcional s�o os seguintes:

1. Valor �Magic� (2 bytes) � define o tipo de arquivo (010B=Execut�vel, 0107=Imagem ROM)

2. Maior vers�o do lincador[3] (linker) (1 byte)

3. Menor vers�o do lincador3 (linker) (1 byte)

4. Tamanho do c�digo execut�vel (4 bytes)

5. Tamanho de dados de inicializa��o (segmento de dados) (4 bytes)

6. Tamanho de dados de n�o-inicializa��o (segmento BSS) (4 bytes)

7. RVA[4] de entrada do c�digo do execut�vel (4 bytes)

8. RVA da base do c�digo (4 bytes)

9. RVA da base dos dados (4 bytes)

10. Base da imagem - endere�o de mapeamento preferencial (4 bytes)

11. Alinhamento da se��o na RAM (4 bytes)

12. Alinhamento do arquivo em disco (4 bytes)

13. Vers�o m�xima (2 bytes) do sistema operacional esperado[5]

14. Vers�o m�nima (2 bytes) do sistema operacional esperado5

15. Vers�o m�xima (2 bytes) do arquivo PE[6]

16. Vers�o m�nima (2 bytes) do arquivo PE6

17. Vers�o m�xima (2 bytes) do subsistema esperado[7]

18. Vers�o m�nima (2 bytes) do subsistema esperado7

19. Vers�o do Win32 (4 bytes) � sempre zerado

20. Tamanho da imagem (4 bytes) � � a soma dos tamanhos dos cabe�alhos e se��es. Este campo serve como dica para o carregador do sistema (system loader) saber quanto de mem�ria alocar para carregar o programa

21. Tamanho dos cabe�alhos (4 bytes) - � a soma dos tamanhos dos cabe�alhos, incluindo diret�rios de dados e cabe�alhos de se��es

22. CheckSum do arquivo PE (4 bytes)

23. Subsistema requerido (2 bytes) � (normalmente possui o valor 2, referente a programas Win32 GUI)

24. Caracter�sticas de DLL (2 bytes)

25. Tamanho de reserva de pilha (4 bytes)

Figura 4. Cabe�alho opcional

26. amanho inicial da pilha salva (4 bytes)

27. Tamanho da reserva de heap (4 bytes)

28. Tamanho inicial heap salvo (4 bytes).

29. Flags para o carregador do sistema operacional (4 bytes)

30. N�mero e tamanho de RVAs (4 bytes)

31. Diret�rio de Dados (� um array de 16 descritores de diret�rios, com localiza��o (RVA) e o tamanho de cada pe�a de informa��o)

Cabe�alho de Se��es

Os cabe�alhos de se��o s�o as descri��es que antecedem a se��o propriamente dita.

Um cabe�alho de se��o cont�m:

1. Um array (8 bytes) com o nome das se��o

2. Tamanho virtual da se��o (4 bytes)

3. Endere�o f�sico da se��o (4 bytes)

4. Tamanho alinhado (4 bytes) - tamanho dos dados da se��o arredondado para cima para o pr�ximo m�ltiplo do alinhamento de arquivo

5. Offset do in�cio do arquivo em disco at� os dados da se��o (4 bytes)

6. Ponteiro para remanejamento (4 bytes) � apenas para arquivos-objeto

7. Ponteiro para n�meros de linha (4 bytes) � apenas para arquivos-objeto

8. N�mero de remanejamentos (2 bytes) � apenas para arquivos-objeto

9. Quantidade de n�meros de linha (2 bytes) � apenas para arquivos-objeto

10. Caracter�sticas que descrevem como a mem�ria da se��o deve ser tratada (4 bytes) (por bit flag)

Se��es

Ap�s os cabe�alhos das se��es seguem as se��es.

Existem v�rios tipos de se��es, dependendo do seu conte�do, e s�o nelas que ficam salvas as instru��es, recursos (resources) e todos os dados e informa��es do programa propriamente dito. Cada se��o possui algumas flags sobre alinhamento, o tipo de dados que cont�m, se pode ser compartilhada, etc.

Em resumo, � nesta se��o onde s�o gravadas os c�digos do programa.

Conclus�es

Um bom conhecimento e compreens�o de como � e funciona o formato PE leva a um bom conhecimento e compreens�o do sistema operacional em um todo.

Conhecer como funcionam internamente suas bibliotecas e execut�veis faz com que o desenvolvedor n�o saiba somente mais sobre programa��o, mas sim aprende e descobre tudo o que ocorre com sua aplica��o e toda intera��o com o sistema operacional, ponto este fundamental para o desenvolvimento de software com qualidade e profissionalismo.

Daniel Dummer (danieldummer@gmail.com) � � Bacharelando em Ci�ncia da Computa��o pelo Centro Universit�rio Feevale. Programador Delphi a 5 anos, trabalha com dbExpress em projetos cliente/servidor, al�m de projetos COM+ e ASP.

[1] Cracking � o nome dado a a��es de modifica��es no funcionamento de um sistema, de maneira geralmente ilegal, para que determinados usu�rios ganhem algo com isso.

[2] Common Object File Format: Formato comum de arquivo-objeto dos sistemas UNIX, VMS e VAX.

[3] A jun��o dos bytes dos itens 2 e 3 formam a vers�o do lincador utilizada para lincar o arquivo.

[4] � um endere�o virtual relativo, utilizado para definir um endere�o de mem�ria caso se desconhe�a o endere�o base. � o valor que, adicionado ao endere�o base, fornece o endere�o linear

[5] A jun��o dos bytes dos itens 13 e 14 formam a vers�o m�nima esperada do sistema operacional

[6] A jun��o dos bytes dos itens 15 e 16 formam a vers�o do arquivo PE

[7] A jun��o dos bytes dos itens 17 e 18 formam a vers�o m�nima esperada do subsistema