Bytecode: Explicamos a estrutura dos arquivos do Bytecode

Por que eu devo ler este artigo: Entender o bytecode � um conhecimento necess�rio para o uso de bibliotecas que permitem gerar c�digo dinamicamente, ou mesmo para ter dom�nio do que acontece �por baixo do pano� ao usar ferramentas que fazem isso por voc� (como APIs de ORM, AOP, e outras).

Preocupado com a prote��o de Propriedade Intelectual do seu c�digo? Ou curioso com todos os artigos, ferramentas e bibliotecas de gera��o de c�digo que falam no tal bytecode?

Desenvolvedores de software de c�digo fechado muitas vezes se preocupam com a prote��o da sua Propriedade Intelectual, n�o desejando que nenhum �curioso� possa descompilar facilmente suas classes. Para isso, exploramos a ferramenta open source ProGuard. Veremos tamb�m o aspecto de otimiza��o de bytecode, devido ao qual estas ferramentas podem ser muito �teis at� mesmo para projetos de c�digo aberto.

Este artigo trata de um tema com aspectos importantes tanto do n�vel te�rico quanto do pr�tico. Vamos falar do bytecode do Java: sua estrutura, design, vantagens e limita��es, seu papel dentro da plataforma. Mas vamos estudar isso no contexto de uma aplica��o importante, a pr�tica de ofuscamento e otimiza��o (ou sua reversa: descompila��o) de classes. A princ�pio voc� poderia aprender a usar estas ferramentas de uma forma superficial, simplesmente lendo suas instru��es e usando facilitadores como plug-ins para IDEs. Mas o real dom�nio de qualquer ferramenta sempre depende de saber o que acontece �por baixo do pano�.

Por que conhecer o �execut�vel� do Java?

Quando eu cursava a gradua��o, a linguagem da vez era C/C++, gerando execut�veis nativos. E uma das melhores li��es sobre arquitetura de computadores tratou do formato execut�vel nativo na plataforma Wintel: .EXE, .DLL, .OBJ e .LIB. Lembro de um trabalho pr�tico que consistia em fazer o parsing de um arquivo .OBJ e exibir seu conte�do detalhado � algo como o javap do JDK, mas bem mais complexo pois o formato usado pelo Windows, o COFF, tem um design de baixo n�vel. Era um daqueles trabalhos que muitos estudantes detestam por que (al�m de dif�cil) n�o teria aplica��o para a enorme maioria dos projetos de software no �mundo real�. No entanto, com o passar dos anos vi que poucos t�picos de estudo me foram t�o �teis para adquirir um insight aprofundado de v�rias coisas � linguagens de programa��o, compiladores, sistemas operacionais.

O formato dos arquivos que armazenam um programa execut�vel � de import�ncia fundamental, pois tem enorme envolvimento em v�rios aspectos da linguagem. Se voc� duvida, basta ver como podemos categorizar linguagens/plataformas em fam�lias coerentes, pelo seu formato execut�vel: veja o quadro �Linguagens, por Formato Execut�vel�.

Linguagens nativas

Usam o formato execut�vel nativo do S.O., como COFF, ELF ou Mach-O. � o formato mais eficiente em tempo de carregamento/inicializa��o e consumo de mem�ria (pois facilita o compartilhamento entre processos). Mas � a op��o mais r�gida, inviabilizando a cria��o de aplica��es mais din�micas. Parte do princ�pio que todo o c�digo-fonte que contribuir� para uma aplica��o est� dispon�vel no momento da compila��o, e que uma vez criado um processo, nenhum c�digo ser� criado ou alterado.

Aplica��es nativas podem carregar �bibliotecas din�micas� (.DLLs/.SOs), mas isso � s� uma facilidade de organiza��o e compartilhamento de c�digo. Em teoria a aplica��o poderia gerar fontes e compil�-los, mas na pr�tica isso � muito dif�cil, pois a compila��o de execut�veis nativos � um processo relativamente lento e pesado.

Scripting

O extremo oposto: linguagens sem nenhum formato execut�vel. Os fontes s�o �executados� diretamente. Comum entre shells (CMD, sh, bash etc.), linguagens de macros ou automa��o de aplica��es (VBA), na web (JavaScript), utilit�rios complexos (awk), e as chamadas �linguagens de scripting� (Perl, Python, Ruby etc.) populares para criar programas simples de forma r�pida. Ou como o componente din�mico de sistemas maiores, como sites web de primeira gera��o criados com CGI e scripts Perl. Este �ltimo cen�rio de uso deu origem � express�o glue language, pois a linguagem de scripting fazia apenas um meio-de-campo, �amarrando� processos nativos como webserver e SGBD.

Este modelo (como todos os posteriores) exige o uso de uma JVM (Virtual Machine) capaz de interpretar o programa, j� que o S.O. n�o � capaz de faz�-lo.

Saiba mais: Introdu��o ao Java Virtual Machine (JVM)

Bytecode

Linguagens como Java, compiladas para um formato bin�rio pr�prio e port�vel. Coloco �nfase no �pr�prio�, pois embora se fale muito da portabilidade, tamb�m h� vantagens no fato do formato ser projetado especialmente para as necessidades da linguagem � e n�o para as de algum S.O. Linguagens nesta categoria s�o praticamente t�o din�micas quanto as de scripting, pois seus bytecodes facilitam a manipula��o e gera��o din�mica, permitindo o uso de APIs sofisticadas de reflection e metaprograma��o, e mesmo, cria��o de c�digo totalmente novo em demanda.

O bytecode tamb�m exige o uso de uma JVM (Java Virtual Machine), sendo mais comum que a VM seja capaz de gerar c�digo nativo em demanda (JIT).

Uma linguagem interpretada tamb�m poderia usar compila��o JIT. Mas na pr�tica isso � incomum, pois sem um formato intermedi�rio de bytecode, a JVM precisa fazer o parsing dos fontes, um processo relativamente demorado e que �bate de frente� com a necessidade de compiladores JIT de fazerem seu trabalho o mais r�pido poss�vel. A exce��o not�vel � o JavaScript, cujas VMs mais atuais s�o obrigadas a carregar o programa de c�digo-fonte (pois � o formato padr�o da web) mas geram bytecode internamente, seja para interpreta��o ou compila��o JIT.

Imagem

Uma categoria menos conhecida, mas bastante interessante, foi adotada por linguagens pioneiras das VMs, como Lisp e Smalltalk. Nestes sistemas, o processo de compila��o cria objetos na mem�ria; para preservar num arquivo o c�digo, � feito um dump da �imagem� (estado da VM, inclusive o heap, stacks de threads, e outros dados). Isso se parece com o recurso de hiberna��o de S.Os. modernos. Exceto pelo fato que, ap�s gerada, a imagem pode ser carregada v�rias vezes, gerando processos independentes com um estado inicial id�ntico (algo como o fork() do UNIX). � uma vis�o �purista� do conceito de VM, no qual n�o h� uma dicotomia entre arquivo execut�vel e processo, s� estados diferentes da mesma coisa � ou seus objetos est�o ativos num processo, ou est�o hibernando numa imagem em disco.

Este modelo foi praticamente abandonado, pois tem desvantagens como estabilidade, dificuldade de trabalhar com sistema de controle de vers�es, e o car�ter monol�tico da �imagem� dificultando a cria��o de uma arquitetura de componentes.

Saiba mais: Guia de Linguagem Java

Algumas empresas de Smalltalk criaram tecnologias para contornar estas limita��es, como as �Parcels� do VisualWorks (componentiza��o) ou o ENVY da OTI (versionamento). N�o sei se estas solu��es foram insuficientes para o problema, ou se falharam apenas por chegar muito tarde ao mercado, ou por que o Smalltalk acabou morrendo por outros motivos.

Lendo o bytecode com o javap

Come�aremos falando um pouco do bytecode do Java. Ou de forma mais precisa, o formato das classes do Java. Para explorar o assunto de forma mais concreta, come�aremos examinando alguma classe de exemplo. Vejamos, por exemplo, a classe java.util.Stack da API do Java. Para inspecion�-la, voc� pode utilizar o utilit�rio javap do JDK:


C:\>javap java.util.Stack

Compiled from "Stack.java"

public class java.util.Stack extends java.util.Vector{

    public java.util.Stack();

    public java.lang.Object push(java.lang.Object);

    public synchronized java.lang.Object pop();

    public synchronized java.lang.Object peek();

    public boolean empty();

    public synchronized int search(java.lang.Object);

}

Na sua forma mais simples, o javap exibe o que se parece com o c�digo-fonte da classe, exceto pela aus�ncia do c�digo (corpo dos m�todos ou express�es de inicializa��o de atributos). Mas note que j� aparece outra novidade, uma mensagem �Compiled from...� que indica o nome do arquivo-fonte que gerou esta classe. Isso � um exemplo simples de metadados do arquivo .class.

Listagem 1. Conte�do completo de uma classe (com os fontes adicionados).


C:\>javap -v �private java.util.Stack

Compiled from "Stack.java"

public class java.util.Stack extends java.util.Vector

  SourceFile: "Stack.java"

  Signature: length = 0x2

   00 21

  minor version: 0

  major version: 49

  Constant pool:

const #1 = Asciz        ()I;

const #2 = Asciz        ()TE;;

const #3 = Asciz        ()V;

const #4 = Asciz        ()Z;

const #5 = Asciz        (I)V;

const #6 = Asciz        (TE;)TE;;

const #7 = Asciz        <init>;

const #8 = Asciz        Code;

const #9 = Asciz        ConstantValue;

const #10 = Asciz       J;

const #11 = Asciz       LineNumberTable;

const #12 = Asciz       Signature;

const #13 = Asciz       SourceFile;

const #14 = Asciz       addElement;

const #15 = Asciz       elementAt;

const #16 = Asciz       empty;

const #17 = Asciz       java/util/EmptyStackException;

const #18 = Asciz       java/util/Stack;

const #19 = Asciz       java/util/Vector;

const #20 = Asciz       lastIndexOf;

const #21 = Asciz       peek;

const #22 = Asciz       pop;

const #23 = Asciz       push;

const #24 = Asciz       removeElementAt;

const #25 = Asciz       search;

const #26 = Asciz       serialVersionUID;

const #27 = Asciz       size;

const #28 = long        1224463164541339165l;

const #30 = class       #17;    //  java/util/EmptyStackException

const #31 = class       #18;    //  java/util/Stack

const #32 = class       #19;    //  java/util/Vector

const #33 = Asciz       <E:Ljava/lang/Object;>Ljava/util/Vector<TE;>;;

const #34 = Asciz       ()Ljava/lang/Object;;

const #35 = Asciz       (I)Ljava/lang/Object;;

const #36 = Asciz       (Ljava/lang/Object;)I;

const #37 = Asciz       (Ljava/lang/Object;)V;

const #38 = Asciz       (Ljava/lang/Object;)Ljava/lang/Object;;

const #39 = NameAndType #27:#1;//  size:()I

const #40 = NameAndType #7:#3;//  "<init>":()V

const #41 = NameAndType #24:#5;//  removeElementAt:(I)V

const #42 = NameAndType #21:#34;//  peek:()Ljava/lang/Object;

const #43 = NameAndType #15:#35;//  elementAt:(I)Ljava/lang/Object;

const #44 = NameAndType #20:#36;//  lastIndexOf:(Ljava/lang/Object;)I

const #45 = NameAndType #14:#37;//  addElement:(Ljava/lang/Object;)V

const #46 = Method      #30.#40;        //  java/util/EmptyStackException."<init>":()V

const #47 = Method      #31.#39;        //  java/util/Stack.size:()I

const #48 = Method      #31.#41;        //  java/util/Stack.removeElementAt:(I)V

const #49 = Method      #31.#42;        //  java/util/Stack.peek:()Ljava/lang/Object;

const #50 = Method      #31.#43;        //  java/util/Stack.elementAt:(I)Ljava/lang/Object;

const #51 = Method      #31.#44;        //  java/util/Stack.lastIndexOf:(Ljava/lang/Object;)I

const #52 = Method      #31.#45;        //  java/util/Stack.addElement:(Ljava/lang/Object;)V

const #53 = Method      #32.#40;        //  java/util/Vector."<init>":()V

const #54 = Asciz       Stack.java;

 

{

private static final long serialVersionUID;

  Constant value: long 1224463164541339165l

public java.util.Stack();

  Code:

   Stack=1, Locals=1, Args_size=1

   0:   aload_0

   1:   invokespecial   #53; //Method java/util/Vector."<init>":()V

   4:   return

  LineNumberTable:

   line 36: 0

   line 37: 4

 

 

public java.lang.Object push(java.lang.Object);

  Code:

   Stack=2, Locals=2, Args_size=2

# addElement(item);

   0:   aload_0

   1:   aload_1

   2:   invokevirtual   #52; //Method addElement:(Ljava/lang/Object;)V

# return item;

   5:   aload_1

   6:   areturn

  LineNumberTable:

   line 50: 0

   line 52: 5

 

  Signature: length = 0x2

   00 06

 

public synchronized java.lang.Object pop();

  Code:

   Stack=3, Locals=3, Args_size=1

# int len = size();

   0:   aload_0

   1:   invokevirtual   #47; //Method size:()I

   4:   istore_2

# E obj = peek();

   5:   aload_0

   6:   invokevirtual   #49; //Method peek:()Ljava/lang/Object;

# removeElementAt(len - 1);

   9:   astore_1

   10:  aload_0

   11:  iload_2

   12:  iconst_1

   13:  isub

   14:  invokevirtual   #48; //Method removeElementAt:(I)V

# return obj;

   17:  aload_1

   18:  areturn

  LineNumberTable:

   line 65: 0

   line 67: 5

   line 68: 10

   line 70: 17

 

  Signature: length = 0x2

   00 02

 

public synchronized java.lang.Object peek();

  Code:

   Stack=3, Locals=2, Args_size=1

# int len = size();

   0:   aload_0

   1:   invokevirtual   #47; //Method size:()I

   4:   istore_1

# if (len == 0) {

   5:   iload_1

   6:   ifne    17

# throw new EmptyStackException();

   9:   new     #30; //class java/util/EmptyStackException

   12:  dup

   13:  invokespecial   #46; //Method java/util/EmptyStackException."<init>":()V

   16:  athrow

# }

# return elementAt(len - 1);

   17:  aload_0

   18:  iload_1

   19:  iconst_1

   20:  isub

   21:  invokevirtual   #50; //Method elementAt:(I)Ljava/lang/Object;

   24:  areturn

  LineNumberTable:

   line 82: 0

   line 84: 5

   line 85: 9

   line 86: 17

 

  Signature: length = 0x2

   00 02

 

public boolean empty();

  Code:

   Stack=1, Locals=1, Args_size=1

# return size() == 0;

   0:   aload_0

   1:   invokevirtual   #47; //Method size:()I

   4:   ifne    11

   7:   iconst_1

   8:   goto    12

   11:  iconst_0

   12:  ireturn

  LineNumberTable:

   line 96: 0

 

public synchronized int search(java.lang.Object);

  Code:

   Stack=2, Locals=3, Args_size=2

# int i = lastIndexOf(o);

   0:   aload_0

   1:   aload_1

   2:   invokevirtual   #51; //Method lastIndexOf:(Ljava/lang/Object;)I

   5:   istore_2

# if (i >= 0) {

   6:   iload_2

   7:   iflt    17

# return size() - i;

   10:  aload_0

   11:  invokevirtual   #47; //Method size:()I

   14:  iload_2

   15:  isub

   16:  ireturn

# }

# return -1;

   17:  iconst_m1

   18:  ireturn

  LineNumberTable:

   line 114: 0

   line 116: 6

   line 117: 10

   line 119: 17

}

Para tirar um Raio-X completo, vamos usar as op��es �v (verbose) e �private. Veja o resultado na Listagem 1. Na mesma listagem, adicionei o c�digo-fonte da classe em linhas iniciadas por #; infelizmente o javap n�o gera tais linhas, fiz esta altera��o manualmente para facilitar a leitura.

A primeira coisa que voc� deve ter notado � que, antes dos m�todos, o output come�a com uma longa listagem de metadados. No comecinho temos alguns headers, como os n�meros de vers�o da classe: major=49 e minor=0 indicam o formato do Java SE 6; nenhuma JVM de especifica��o inferior ser� capaz de carregar esta classe, mas qualquer JVM deste n�vel (ou superior) ser� capaz. Depois, temos um grande n�mero de linhas �const...�. Esse � o famoso Constant Pool (CP), uma tabela de dados constantes que existe no come�o de qualquer classe Java.

O CP cont�m constantes de v�rios tipos: strings, valores num�ricos primitivos, e s�mbolos. As primeiras s�o mais f�ceis de entender, por exemplo, a constante #28 � do tipo long. Podemos ver que este � o valor do atributo privado serialVersionUID, logo no in�cio da classe. Todas as constantes literais utilizadas por atributos ou c�digo de uma classe s�o armazenadas no Constant Pool, e referenciados atrav�s de seus �ndices.

J� as constantes simb�licas s�o estruturas usadas internamente para a linkagem entre classes, ou seja, refer�ncias entre classes, m�todos e outros artefatos de c�digo. Por exemplo, adiantando a leitura para o m�todo push(), vemos que h� uma invoca��o para o m�todo addElement() (herdado da classe base java.util.Vector). Este m�todo � referenciado pela constante #52 � ou seja, l� no meio do bytecode de push() encontraremos o valor 52, n�o um nome ou endere�o do m�todo. A JVM usa este valor como �ndice do CP para encontrar uma estrutura do tipo Method. Esta estrutura (que nada tem a ver com a API java.lang.reflect.Method) � composta por outras duas constantes, #31 e #45. A constante #31 � uma class, tamb�m definida com um ponteiro para outra constante, a #18: uma Asciz (string ASCII) com o valor java/util/Vector. Assim, decodificamos a primeira parte do Method #52: � uma refer�ncia para a classe java.util.Vector. Para a segunda parte, seguimos a constante #45 que � do tipo NameAndType, composto tamb�m de duas constantes: #14 e #37. Ambas s�o do tipo Asciz, sendo #14 = "addElement" e #37 = "(Ljava/lang/Object;)V".

Ou seja, uma refer�ncia completa para um m�todo exige especificar tanto a classe quanto o m�todo, sendo que para o m�todo, precisamos indicar o nome do m�todo e tamb�m um segundo valor string que � sua assinatura. A assinatura � uma conven��o da especifica��o Java, que codifica todos os par�metros e tamb�m o tipo de retorno do m�todo. Esta codifica��o � razoavelmente f�cil de ler, pois se parece com a declara��o do m�todo. Mas os tipos b�sicos s�o codificados de forma especial, com uma �nica letra � por exemplo, "V" = void, sendo o tipo de retorno do m�todo e vindo ao final da assinatura. E os tipos n�o-primitivos (classes) s�o prefixados por "L", como Ljava/Lang/Object, que indica um par�metro do tipo java.lang.Object. As assinaturas tamb�m usam "/" no lugar de "." como separador de package.

Atrav�s das constantes simb�licas do CP, a JVM, ao carregar a classe, resolve todas as refer�ncias que possam existir para outros m�todos e classes. Como parte do processo de classloading, estas refer�ncias simb�licas s�o tipicamente substitu�das por refer�ncias mais diretas (como um ponteiro para o endere�o de mem�ria onde o elemento referenciado foi carregado), mas isso � um detalhe de implementa��o / otimiza��o da JVM.

Analisando um m�todo

Vamos, agora, ao bytecode propriamente dito. O qual possui este nome por que todas as opera��es s�o codificadas por um �nico byte (assim, existem no m�ximo 256 opera��es). Algumas opera��es podem ser seguidas de bytes adicionais para os par�metros; estes par�metros s�o ou n�meros inteiros, ou �ndices para o Constant Pool.

Como exemplo, tomemos o c�digo do m�todo peek(). Vamos destrinch�-lo, passo a passo:


public synchronized java.lang.Object peek();

  Code:

   Stack=3, Locals=2, Args_size=1

A linha acima declara o formato do stack frame do m�todo. Quando o m�todo inicia sua execu��o, a JVM deve criar um novo frame � uma regi�o de mem�ria no stack do thread. Este frame ter� tr�s posi��es (cada uma de uma �palavra� de 32 bits). Destas, duas s�o para vari�veis locais e uma � para um par�metro � no caso, o this, par�metro intr�nseco de qualquer m�todo de inst�ncia.


# int len = size();

  0:   aload_0

  1:   invokevirtual   #47; //Method size:()I

  4:   istore_1

Para invocar m�todos, os par�metros s�o empilhados no stack. O m�todo size() tamb�m possui somente o par�metro this. Come�amos com uma instru��o aload, que significa �coloque na pilha (push) uma refer�ncia para objeto�. Essa instru��o tem um par�metro, um �ndice de vari�vel local. No caso � o �ndice 0, que � o �ndice do this de peek(). E como � muito comum executar aload com o par�metro 0, existe um bytecode especial aload_0 que n�o exige nenhum par�metro, sendo hardwired para o �ndice 0. Assim, esta instru��o exige um �nico byte, na posi��o 0 do m�todo.

Uma vez passados os par�metros, a invoca��o � feita por bytecodes invoke*, conforme o tipo do m�todo-alvo. No caso, usamos invokevirtual pois Vector.size() � virtual (m�todo definido por uma classe, de inst�ncia (n�o static), e polim�rfico (n�o final nem private). O invokevirtual exige um par�metro que identifica o m�todo a invocar; este par�metro � um �ndice de 16 bits para o CP. Por isso, a instru��o completa ocupa 3 bytes, nas posi��es 1 (o bytecode), 2 e 3 (o �ndice #47).

O m�todo size() �consome� os par�metros deixados no stack, e ao retornar empilha o valor gerado, no caso um int. Assim, ap�s o invokevirtual o stack n�o ter� mais aquele valor empilhado pelo aload_0, mas ter� o int com o tamanho do Vector. Finalmente, istore_1 armazena o int que est� no topo do stack na vari�vel local de �ndice 1 (que � len), executando a atribui��o.


# if (len == 0) {

  5:   iload_1

  6:   ifne    17

A JVM � uma �m�quina de pilha�, onde n�o s� os par�metros e retornos de m�todo, mas todos os valores manipulados residem no stack (n�o h� �registradores� como os de CPUs). No c�digo acima, iload_1 empilha o valor da vari�vel int de �ndice 1, len. Ent�o, ifne faz um desvio condicional com base na compara��o entre o int no topo da pilha e 0[4]. Assim, iload_1 / ifne equivale a if (len != 0).

O ifne possui como par�metro um Bytecode Index (bce) de 16 bits, no caso 17, que diz para onde desviar se o resultado da compara��o de um int com 0 for not equal. � por isso que o bytecode codifica um len != 0 (o oposto do c�digo-fonte), pois se o valor n�o for 0, pulamos o c�digo a seguir, que gera a exce��o. � comum que o javac inverta a ordem de desvios condicionais para simplificar o bytecode resultante, procurando utilizar o menor n�mero poss�vel de desvios.


# throw new EmptyStackException();

  9:   new     #30; //class java/util/EmptyStackException

  12:  dup

  13:  invokespecial   #46; //Method java/util/EmptyStackException."<init>":()V

  16:  athrow

# }

O c�digo acima, que s� executa se len == 0 (pois o ifne n�o fez o desvio), lan�a uma exce��o. Primeiro criamos o objeto de exce��o com o bytecode new, cujo par�metro � o �ndice da constante com a refer�ncia simb�lica para a classe EmptyStackException. O new deixar� a refer�ncia para o objeto criado no topo do stack. Depois o bytecode dup duplica qualquer coisa que estava no topo do stack � teremos, ent�o, duas refer�ncias para a exce��o. A primeira delas ser� consumida pelo invokespecial, que invoca o construtor da exce��o (<init> � o nome de todos os construtores, no bytecode). A segunda refer�ncia � consumida pelo athrow, que executa o throw da exce��o.


# return elementAt(len - 1);

  17:  aload_0

  18:  iload_1

  19:  iconst_1

  20:  isub

No trecho acima, os bytecodes 18-20 implementam a express�o len � 1. Come�amos com o iload_1 (empilha len), depois iconst_1 (empilha a constante int 1), e finalmente isub realiza uma subtra��o inteira entre os dois valores mais no topo do stack e empilha o resultado.


  21:  invokevirtual   #50; //Method elementAt:(I)Ljava/lang/Object;

  24:  areturn

Agora invocaremos elementAt(), que exige dois par�metros (this e um int). O primeiro, this, j� havia sido passado pelo bytecode 17, o aload_0. Depois disso executamos os bytecodes 18-20, que calculam len � 1 e empilham o resultado; assim, neste ponto o stack ter� precisamente os valores exigidos por elementAt(). Ent�o basta fazer o invokevirtual deste m�todo, que mais uma vez, deixar� o valor retornado no topo do stack � sendo que dessa vez, uma refer�ncia para objeto. Finalmente, o bytecode areturn realiza um return do valor de tipo refer�ncia que est� no topo do stack.


LineNumberTable:

   line 82: 0

   line 84: 5

   line 85: 9

   line 86: 17

Ap�s o bytecode, temos um atributo LineNumberTable que relaciona os �ndices de bytecode com as linhas de c�digo. Este atributo � �til, em especial, para depuradores e para o preenchimento do stack trace de exce��es.

Existem tamb�m outros atributos que n�o mostramos, como o Exception table que mapeia blocks try/catch ou o InnerClass que mapeia classes aninhadas. Tamb�m n�o entramos no detalhe de tipos gen�ricos do Java 5, que exigem mais alguns malabarismos no Constant Pool. Mas estes s�o detalhes incrementais; a partir do que for exposto, o leitor s� precisa de uma refer�ncia completa da especifica��o da JVM (ver java.sun.com/docs/books/jvms/) � e alguma paci�ncia � para ler diretamente qualquer classe Java, no formato de bytecode.

Se o leitor quiser utilizar bibliotecas de gera��o din�mica de classes, como o ASM ou CGLIB, precisar� ter familiaridade com a estrutura do bytecode. Veja �A Din�mica do Java�, Edi��o 14.

Ofuscadores/Otimizadores de Bytecode

Nosso principal foco pr�tico � nas ferramentas de ofusca��o e otimiza��o de bytecode Java. (Veja o quadro �A necessidade de ofuscamento�.) Existe uma variedade dessas ferramentas, com algumas diferen�as de capacidade e usabilidade, mas todas s�o conceitualmente iguais. Vamos adotar no artigo o ProGuard, por ser a mais popular solu��o open source.

Comece baixando o ProGuard de proguard.sourceforge.net. No momento em que escrevo, a �ltima vers�o est�vel � a 4.2, mas aproveitarei a empreitada para testar o 4.3, hoje em desenvolvimento (usei o beta3), mas talvez j� finalizado quando voc� receber esta edi��o.

[nota] ADVERT�NCIA: jamais use uma vers�o n�o-est�vel de um ofuscador para seu �trabalho s�rio�. Ofuscadores s�o ferramentas perigosas, e os melhores s�o os mais perigosos. Qualquer bug pode resultar em arquivos .class/.jar que n�o funcionam, gerando erros bizarros da JVM tais como ClassFormatError, LinkageError ou VerifyError. [/nota]

O ProGuard pode ser usado de v�rias formas: linha de comando, Ant/Maven, plug-ins de IDEs, ou sua GUI pr�pria. Esta �ltima op��o � uma novidade da vers�o 4.3, e muito did�tica por expor de forma clara as muitas op��es do ProGuard. Assim, comece executando bin/proguardgui (Figura 1).

[nota] Na falta desta GUI, o ProGuard exige arquivos de configura��o bastante complexos, especificando as mesmas op��es numa sintaxe pr�pria. Ou XMLs do Ant ou Maven com as mesmas op��es, que podem ser encapsuladas pelo XML e v�rias formas. Ou ainda, as GUIs espec�ficas de plug-ins de IDEs. Como a lista de op��es � bastante extensa, n�o pretendemos com este artigo fornecer uma refer�ncia ou manual do usu�rio do ProGuard, pois isso tomaria um espa�o enorme; preferimos focar apenas nos conceitos e funcionalidades. [/nota]

Para testar o ProGuard, precisamos de alguma aplica��o Java j� compilada, mas n�o j� ofuscada. Escolhi duas: o demo Font2DTest do JDK 6 (demo/jfc/Font2DTest); e o Java PC, um emulador de PC visto na Edi��o anterior (www-jpc.physics.ox.ac.uk/JPC.jar). Reporto resultados para ambos os testes, mas advirto o leitor que o processamento do JPC � bem lento (v�rios minutos).

A GUI do ProGuard � muito simples. Come�ando pela aba Input/Output, use Add Input para selecionar o arquivo jar da aplica��o original, e Add Output para nomear o arquivo que ser� criado. Ambas as aplica��es que escolhi s�o simples, possuem apenas um jar de entrada e nenhuma depend�ncia de compila��o (s� as APIs do JDK, que o ProGuard j� configura por default).

O ProGuard oferece um enorme n�mero de op��es, organizadas pela GUI nas seguintes abas:

Shrinking: Op��es de otimiza��o do tamanho das classes;
Obfuscation: Op��es de ofuscamento, ou seja, �embaralhamento� das classes para dificultar sua descompila��o / engenharia reversa;
Optimization: Op��es de otimiza��o de desempenho do bytecode;
Information: Op��es para gera��o de informa��es de pr�-verifica��o (especialmente �teis para Java ME) e corretude (preserva��o de informa��es que poderiam ser exclu�das pelas op��es de otimiza��o ou ofuscamento, mas que podem ser essenciais para o funcionamento da aplica��o).

Para nossos projetos, voc� s� precisar� alterar a op��o Information > Skip non-public library classes, ativada por default; desative-a. Pelo menos com o ProGuard 4.3-beta3 e as duas aplica��es de teste que selecionei, a configura��o default resulta em falha de processamento.

Com a configura��o pronta, execute Process > Process! e aguarde at� o ProGuard reportar sucesso da opera��o. Depois, execute a aplica��o processada, utilizando o arquivo jar gerado pelo ProGuard ao inv�s do original.

Ofuscamento = otimiza��o?

Os ofuscadores surgiram inicialmente para dificultar a descompila��o. Mas os programadores logo perceberam um interessante �efeito colateral�: programas menores, e talvez at� mais r�pidos.

Nos meus testes, as classes do Font2DTest.jar foram reduzidas de 78Kb para 58Kb, uma dieta de 25%. J� as classes do JPC.jar foram reduzidas de 1.277Kb para 693Kb, um enxugamento ainda mais impressionante de 45%. Note que estes n�meros s�o apenas para os .class brutos; a redu��o do tamanho dos jars � menor, devido � compress�o do formato JAR e � presen�a de recursos (como imagens, ou no caso do JPC, enormes �discos virtuais�) que n�o s�o afetados pelo ProGuard.

[nota] Os jars ofuscados poderiam ter ficado ainda menores, bastaria desativar a op��o Information>Preverify, que gera metadados de pr�-verifica��o (usados pelo Java SE 6 e tamb�m no Java ME). Mas isso n�o � recomendado; no Java ME a pr�-verifica��o � obrigat�ria, e no Java SE 6, � ben�fica pois torna o carregamento das classes mais r�pido. [/nota]

Outro dado interessante � a velocidade de carregamento das aplica��es. Testei isso apenas para o JPC, que tem um volume de bytecode grande o bastante para ter impacto sens�vel no tempo de carga e inicializa��o. No meu teste � iniciar o JPC e dar boot na imagem default � o consumo de CPU foi de 11.575ms para o JPC.jar original, e 9.640ms para o JPC.jar ofuscado / otimizado. Este diferencial de 2 segundos � impressionante, pois uma grande fatia do tempo de execu��o deste teste � I/O de discos virtuais, e muito processamento para fazer o boot completo do PC emulado. Estimo que o tempo de carga e inicializa��o das classes tenha ca�do para menos da metade do original.

Estes resultados mostram que os ofuscadores de bytecode s�o muito interessantes mesmo quando n�o existe necessidade de prote��o de Propriedade Intelectual. At� um software open source pode fazer bom proveito dessa ferramenta. (Ali�s, se o c�digo-fonte � fornecido, n�o h� nenhuma vantagem em fornecer os bin�rios num formato que permita f�cil engenharia reversa.) Os seguintes cen�rios indicam o uso de ofuscadores para simples otimiza��o:

Aplica��es distribu�das pela internet, tais como Applets, aplica��es Java WebStart, e Java FX;
Aplica��es m�veis (Java ME), que al�m do tempo de download por rede de operadora, tamb�m enfrentam restri��es de tamanho m�ximo de aplica��o;
Bibliotecas reutiliz�veis, cujos potenciais usu�rios certamente achar�o bem �menos pior� ter que redistribuir um JAR de 1Mb do que um de 2Mb. Lembre que a sua biblioteca pode ser apenas uma entre vinte ou trinta que alguma aplica��o precisar� embutir no seu /lib;

**Figura 2.** Propriedades de ofuscamento no Eclipse MTJ, para projeto Java ME.

No caso espec�fico de Java ME, o suporte integrado a ofuscadores chega a ser um recurso padr�o de IDEs, ver Figura 2. Infelizmente n�o vejo esse suporte para projetos em outras categorias, onde o ofuscamento tamb�m poderia ser muito �til. De qualquer forma, o ProGuard tamb�m pode ser executado na linha de comando ou atrav�s de plugins para o Ant ou Maven.

A efic�cia do ofuscamento

O ofuscamento funciona realmente? Para tirar a prova, selecionei mais ou menos ao acaso um m�todo do c�digo-fonte original do Font2DTest. Compare as quatro vers�es do c�digo na Listagem 2. (Em cada caso, exibo apenas a metade inicial do m�todo, que � suficiente para a discuss�o.) As vers�es descompiladas foram geradas com o JAD (Java Decompiler), um descompilador gratuito dispon�vel em www.kpdus.com/jad.html.

Listagem 2. M�todo avaliado par ofuscamento.

FONTE ORIGINAL


/// Resets the scrollbar to display correct range of text currently on screen

/// (This scrollbar is not part of a "ScrollPane". It merely simulates its effect by

///  indicating the necessary area to be drawn within the panel.

///  By doing this, it prevents creating gigantic panel when large text range,

///  i.e. CJK Ideographs, is requested)

private void resetScrollbar( int oldValue ) {

  int totalNumRows = 1, numCharToDisplay;

  if ( textToUse == RANGE_TEXT || textToUse == ALL_GLYPHS ) {

    if ( textToUse == RANGE_TEXT )

      numCharToDisplay = drawRange[1] - drawRange[0];

    else /// textToUse == ALL_GLYPHS

      numCharToDisplay = testFont.getNumGlyphs();

 

    totalNumRows = numCharToDisplay / numCharAcross;

    if ( numCharToDisplay % numCharAcross != 0 )

       totalNumRows++;

    if ( oldValue / numCharAcross > totalNumRows )

      oldValue = 0;

 

    verticalBar.setValues( oldValue / numCharAcross,

      numCharDown, 0, totalNumRows );

  }

DESCOMPILADO (BYTECODE ORIGINAL)


private void resetScrollbar(int i)

{

  int j = 1;

  if(textToUse == 0 || textToUse == 1)

  {

    int k;

    if(textToUse == 0)

      k = drawRange[1] - drawRange[0];

    else

      k = testFont.getNumGlyphs();

    j = k / numCharAcross;

    if(k % numCharAcross != 0)

      j++;

    if(i / numCharAcross > j)

      i = 0;

    verticalBar.setValues(i / numCharAcross, numCharDown, 0, j);

  }

DESCOMPILADO (BYTECODE OFUSCADO / OP��ES PADR�O)


private void b(int i1)

{

  int j1;

  if(i.g(D) == 0 || i.g(D) == 1)

  {

    int k1;

    if(i.g(D) == 0)

      k1 = i.i(D)[1] - i.i(D)[0];

    else

      k1 = i.b(D).getNumGlyphs();

    j1 = k1 / a;

    if(k1 % a != 0)

      j1++;

    if(i1 / a > j1)

      i1 = 0;

    i.j(D).setValues(i1 / a, b, 0, j1);

  }

DESCOMPILADO (BYTECODE OFUSCADO / AGRESSIVAMENTE)


private void a(int i1)

{

  int j1;

  i k1;

  if((k1 = a_i_fld).f_int_fld == 0 || (k1 = a_i_fld).f_int_fld == 1)

  {

    i l1;

    int i2;

    if((l1 = a_i_fld).f_int_fld == 0)

      i2 = (l1 = a_i_fld).a_int_array1d_fld[1] �

        (l1 = a_i_fld).a_int_array1d_fld[0];

    else

      i2 = ((i) (i2 = a_i_fld)).a_java_awt_Font_fld.getNumGlyphs();

    j1 = i2 / a_int_fld;

    if(i2 % a_int_fld != 0)

    j1++;

    if(i1 / a_int_fld > j1)

      i1 = 0;

    ((i) (i2 = a_i_fld)).a_javax_swing_JScrollBar_fld

      .setValues(i1 / a_int_fld, b_int_fld, 0, j1);

  }

A primeira descompila��o, feita a partir do bytecode original, difere dos fontes s� pela falta da formata��o original, coment�rios, nomes de vari�veis locais e par�metros (o demo deve ter sido compilado com javac �g:none), e constantes (como RANGE_TEXT � 0). Mas o significado do c�digo ainda � f�cil de deduzir, devido � presen�a de muitos identificadores como resetScrollbar, textToUse, testFont, numCharsAcross, etc.; e � recupera��o da estrutura do c�digo perfeita.

Na segunda descompila��o, feita sobre o bytecode ofuscado, quase todos estes nomes foram eliminados, sendo substitu�dos por outros sem qualquer significado � b, i1, i, g, etc. Os �nicos nomes significativos que restaram foram getNumGlyphs e setValues, mas com t�o pouca ajuda, fica muito mais dif�cil entender um m�todo t�o complexo. Note tamb�m que o ofuscador fez algumas altera��es na estrutura do c�digo: por exemplo, textToUse == 0 virou i.g(D) == 0.

A �ltima descompila��o foi feita para o bytecode ofuscado com algumas op��es extra: Overload aggressively, Repackage classes, Allow Access Modification, e Merge interfaces aggressively. Estas op��es permitem embaralhar ainda mais o c�digo. Por exemplo, o trecho textToUse == 0 foi agora transformado em (k1 = a_i_fld).f_int_fld == 0. Isso vai confundir quem tentar entender o c�digo.

[nota] As otimiza��es e ofuscamentos mais simples s�o basicamente manipula��es do Constant Pool: a ferramenta altera o valor de s�mbolos que representam classes e outros artefatos, substituindo os Asciz com nomes descritivos por outros menores e sem nenhum significado. Tamb�m reduzem o n�mero de constantes, quando conseguem compartilhar o mesmo nome entre v�rios elementos da mesma classe. Mas as otimiza��es/ofuscamentos mais agressivos realizam transforma��es pesadas na seq��ncia de bytecodes dos m�todos, inclusive fazendo �refactorings� como criar, mesclar ou eliminar m�todos, introduzir ou eliminar par�metros, mudar a ordem de par�metros, e at� coisas muito piores. [/nota]

Nosso c�digo est� protegido? Mesmo na �ltima listagem, um programador que tenha bom conhecimento do dom�nio (no caso, c�digo de GUIs) ainda conseguir� deduzir a fun��o do m�todo. Mas � �bvio que isso demandar� um esfor�o muit�ssimo maior de estudo dos fontes; se soubermos o que o m�todo deve fazer, pode ser mais f�cil escrev�-lo do zero do que tentar recuperar fontes intelig�veis a partir de um c�digo t�o ofuscado. Por isso, minha resposta � �Sim�. Para detalhes, veja novamente o quadro �A Necessidade de Ofuscamento�.

Os cuidados com ofuscadores

Dois cuidados b�sicos devem ser tomados com estas ferramentas. O primeiro � n�o ofuscar demais. Ao ofuscar as classes que pertencem a determinado grupo (ex.: um �nico jar, ou um conjunto de jars ofuscados em conjunto), voc� n�o deve alterar a assinatura de nenhuma classe, m�todo ou atributo que seja acess�vel de fora daquele grupo. Ent�o, se o seu util.jar cont�m uma API p�blica Util.fazTudo(), voc� n�o pode mudar o nome deste m�todo (ou reduzir sua visibilidade para private), pois isso �quebraria� outros componentes ou aplica��es que o utilizam. O mesmo vale para c�digo seu que estende algum framework externo: por exemplo, se na sua implementa��o de algum componente Swing, voc� tiver um m�todo paint(Graphics), n�o pode permitir que este m�todo seja renomeado, caso contr�rio este deixar� de ser uma redefini��o de JComponent.paint(Graphics), e sua aplica��o deixar� de funcionar corretamente. Para evitar problemas deste tipo, ofuscadores possuem v�rias espertezas, como n�o mexer em assinaturas de m�todos que redefinem m�todos definidos em classes externas ao conjunto sendo ofuscado. Tamb�m permitem especificar regras de exclus�o, para proteger classes, m�todos ou atributos especificados do ofuscamento.

[nota] Cuidado especial com reflection. Se voc� acessa classes, m�todos ou atributos dinamicamente, com APIs como Class.forname(), getMethod() etc., voc� ter� que dar uma �m�ozinha� ao ofuscador, fornecendo regras de exclus�o que impe�am o ofuscamento de qualquer nome de classe, m�todo ou atributo manipul�vel atrav�s de reflection. Caso contr�rio, o resultado ser� um erro como ClassNotFoundException ou NoSuchMethodException. [/nota]

O segundo problema � que o ofuscamento pode complicar o suporte de aplica��es em produ��o. Se a aplica��o estiver instrumentada para logar exce��es imprevistas, o c�digo ofuscado ter� um stack trace bem confuso � por exemplo, mostrando uma NullPointerException num m�todo b(int).

Como saber que isso se refere ao m�todo resetScrollbar(int)?

Simples, no ProGuard existe uma op��o de gerar um arquivo de mapeamento entre os nomes originais e os obfuscados. De posse destes arquivos, voc� pode posteriormente usar a fun��o �ReTrace� para desembaralhar um stack trace. � �bvio que tais arquivos de mapeamento devem ser mantidos privados, n�o distribu�dos.

Finalmente, os n�veis mais agressivos de ofuscamento e otimiza��o podem ter impacto no desempenho do c�digo. Este impacto pode ser tanto positivo quanto negativo. Algumas transforma��es de bytecode que podem parecer custosas, como a introdu��o de novos m�todos, podem n�o custar nada por serem compensadas por otimiza��es da JVM como inlining � mas � arriscado confiar nisso de olhos fechados. Em contrapartida, as melhores ferramentas s�o capazes de realizar no pr�prio bytecode algumas otimiza��es que normalmente s� s�o feitas por compiladores JIT, tais como elimina��o de express�es redundantes, propaga��o de constantes, etc. (O javac � conhecido por n�o fazer praticamente nenhuma otimiza��o, e isso � assim por design.) O aconselh�vel, para c�digo com caracter�sticas cr�ticas de desempenho, � fazer benchmarks e comparar o desempenho do bytecode original com o ofuscado/otimizado, para garantir que n�o h� nenhuma regress�o.

Ofuscadores evitam que seu c�digo compilado seja muito f�cil de ler. Como vimos, os arquivos .class do Java s�o quase t�o f�ceis de entender quanto os fontes originais. Mesmo que voc� n�o conhe�a a sintaxe do bytecode, basta usar um descompilador como o JAD (www.kpdus.com/jad.html). Isso � obviamente um problema para softwares propriet�rios, de fonte fechado.

Os ofuscadores contornam o problema realizando uma s�rie de altera��es no bytecode. Informa��es de debug (como nomes de vari�veis locais e linhas de c�digo) s�o totalmente eliminadas. Nomes descritivos de classes, m�todos e atributos, como validaConta(), s�o substitu�dos por nomes aleat�rios, como k8(). A estrutura de controle tamb�m pode ser bastante �embaralhada�. Por exemplo, um c�digo como este:


public void algoritmoSecreto () {

    if (x > y) {

        a += 10;

    }

}

Pode ser substitu�do por algo como:


private void a () {

    a += 10;

    while (x - 1 < y) {

        b();

        break;

    }

}

private void b () {

    a -= 10;

}

Ter� exatamente o mesmo efeito, mas � muito mais confuso e dificulta a compreens�o de algoritmos e regras de neg�cio. Al�m de fazer transforma��es de controle e eliminar o nome original do m�todo, o ofuscador tamb�m criou um novo m�todo (um refactoring), e transformou o m�todo original public em private (o que s� � v�lido se este m�todo n�o era invocado de nenhuma outra classe).

Estes truques de ofuscamento n�o impedem totalmente a engenharia reversa do c�digo, por�m, nenhuma t�cnica impede isso. At� para c�digo nativo h� descompiladores, que geram listagens em Assembly bem estruturado, ou at� mesmo em C (ver http://www.itee.uq.edu.au/~cristina/dcc.html). Na pr�tica, o bytecode Java (bem ofuscado!) n�o � muito pior que c�digo nativo. Hackers interessados em plagiar software, ou criar v�rus e outros malwares (tarefa que muitas vezes exige descompilar at� o kernel do S.O. a ser atacado), n�o s�o impedidos por nenhum formato execut�vel. Nem por alguns produtos (tanto ofuscadores Java quanto �protetores� de c�digo nativo) que encriptam o c�digo. Essa t�cnica torna o trabalho mais dif�cil, mas ainda assim poss�vel, pois o c�digo precisa ser decriptado para ser executado. Basta conferir a disponibilidade de �cracks� para qualquer aplica��o, game, ou padr�o de DRM popular. A prote��o absoluta de Propriedade Intelectual digital, com mecanismos puramente de software, � imposs�vel.

Ainda assim, o ofuscamento pode reduzir o problema do n�vel qualquer novato em Java consegue ler o c�digo e entender os algoritmos em 10h para o n�vel somente um expert consegue ler o c�digo, e mesmo assim, levar� 300h para desembaralhar os algoritmos. Para a maioria das finalidades, isso � prote��o suficiente (tornar a engenharia reversa economicamente pouco compensadora).

Uma quest�o comum: o bytecode n�o poderia ter um formato mais dif�cil de entender? Isso seria poss�vel, e � o caso de linguagens antigas como UCSD Pascal e Forth. Mas as linguagens �virtuais� modernas possuem recursos de runtime din�micos, como reflection, suporte a debugging e profiling, serializa��o, gera��o e transforma��o din�micas de c�digo e outros, que exigem um formato bin�rio de alto n�vel e que inclui informa��o simb�lica detalhada. Por isso, � dif�cil ofuscar aplica��es ou APIs que fazem uso intenso destes recursos din�micos. Tipicamente, deve-se fornecer ao ofuscador uma lista de nomes de classes, m�todos e atributos que n�o podem ser ofuscados.

Tudo isso vale igualmente para a plataforma .NET, cujo bytecode � igualmente f�cil de ler. E provavelmente, para qualquer outro padr�o de bytecode / c�digo port�vel.

Conclus�es

O bytecode do Java foi um dos seus chamarizes desde o lan�amento da plataforma, devido � vantagem da portabilidade. Outras vantagens se acumularam com o tempo, como bom desempenho (gra�as a compiladores JIT avan�ados) e capacidades de programa��o din�mica, inclusive gera��o f�cil e eficiente de classes em demanda.

Por outro lado, a facilidade de ler o bytecode sempre foi uma preocupa��o para quem n�o quer compartilhar seus algoritmos com olhares curiosos; e o tamanho do bytecode nunca � suficientemente enxuto, para quem deseja transferi-lo pela internet ou instal�-lo em dispositivos Java ME com limita��es de tamanho de MIDlets. Estas necessidades deram origem � cria��o de ferramentas de ofuscamento e otimiza��o de bytecode; as quais evolu�ram junto com os descompiladores, numa verdadeira competi��o de gato-e-rato. Como um descompilador possui alguns limites imposs�veis de eliminar, por exemplo, n�o tem como deduzir nomes descritivos de elementos do programa, meu veredito (tamb�m baseado na an�lise das ferramentas) � que a briga foi vencida pelos ofuscadores, os quais oferecem um n�vel aceit�vel de prote��o de Propriedade Intelectual, para quem precisa disso.

Uma nota final: muitos softwares propriet�rios possuem licen�as de uso que pro�bem expressamente qualquer t�cnica de engenharia reversa, inclusive e especialmente a descompila��o do bytecode (ou mesmo a visualiza��o do bytecode puro com o javap). Isso � uma infelicidade; eu mesmo j� fui obrigado a ignorar estas licen�as, e descompilar assim mesmo, em v�rias ocasi�es em que tive que diagnosticar bugs dif�ceis, que acabei descobrindo que eram bugs em alguma biblioteca propriet�ria (sem fontes abertos, por�m n�o ofuscada). Mas antes que algu�m venha me processar por tabela, fica o pedido ao leitor: �fa�a o que eu digo, n�o fa�a o que eu fa�o� � n�o descompile programas cujos termos de licen�a pro�bem faz�-lo.

Hardwired: Comportamento que � �amarrado� no c�digo, n�o sendo poss�vel modific�-lo sem alterar os fontes, recompilar e reiniciar a aplica��o. O termo costuma ser aplicado a coisas que poderiam facilmente ser parametrizadas externamente (por arquivo de configura��o, descritor, etc.) � por exemplo, a URL de conex�o com a database da aplica��o � mas n�o o s�o por algum motivo. Pode ser um mau motivo como pregui�a ou indisciplina do programador, ou um bom motivo como otimiza��o (� o caso dos bytecodes com par�metros fixos como aload_0) ou simplicidade (comum em c�digo para artigos, que deve ser did�tico). No Brasil, outra tradu��o que gosto de hardwired � �chumbado�.

Bibliografia

[1] Common Object File Format, usado principalmente pelo Windows.
[2] Executable Linkage Format, usado pela maioria dos UNIX, inclusive Linux.
[3] Usado pelo Mac OS X.
[4] Por que h� instru��es especiais para comparar inteiros com zero? Porque na JVM o tipo boolean n�o existe; a JVM utiliza ints, sendo que 0 = false e qualquer outro valor = true.

Saiu na DevMedia!

React com Redux:
O Redux atende as necessidades de pelo menos um cen�rio comum em aplica��es cliente, facilitando a comunica��o entre componentes sem acopl�-los. Sua import�ncia � tanta atualmente que muitos programadores t�m aconselhado seu uso independente do tamanho da aplica��o, embora ele facilite o seu crescimento.

Saiba mais sobre Java EE ;)

Java Enterprise Edition - Java EE :
Neste Guia de Refer�ncia voc� encontrar� todo o conte�do que precisa para conhecer o Java EE, Java Enterprise Edition, a plataforma Java voltada para o desenvolvimento de aplica��es web/corporativas.

Confira outros conte�dos:

Por Osvaldo Em 2009

Acelere seus resultados com o Prime.

Plano Start

12x R$89,00

Saiba mais

Plano Prime

12x R$199,00

Saiba mais

Plano Prime +

12x R$299,00

Saiba mais

Escolha seu Plano	Plano Start	Plano Prime	Plano Prime +
Forma��o completa Programador
Uso de IAs e automa��es
Exerc�cios gamificados
Projetos pr�ticos
Suporte ao conte�do
Comunidade de alunos
Cursos e artigos em +40 tecnologias
Trilha Monetize seu conhecimento
Mentoria T�cnica personalizada
Mentoria fazendo $ em 60 dias
Mentoria Primeiro emprego
Suporte humanizado 24 horas
Aulas exclusivas com especialistas
Mentorias mensais		2 por m�s	ilimitada
Tempo de assinatura	12 meses	12 meses	12 meses
	Saiba mais	Saiba mais	Saiba mais

Quero tirar uma d�vida

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Bytecode: Escondendo e Revelando

Explicamos a estrutura dos arquivos .class do Java, inclusive o bytecode, que codifica todos os seus m�todos de forma port�vel. Entrando numa aplica��o mais comum e mais pr�tica, examinamos o tema de ofusca��o e descompila��o de c�digo.

Por que conhecer o �execut�vel� do Java?

Linguagens nativas

Scripting

Bytecode

Imagem

Lendo o bytecode com o javap

Analisando um m�todo

Ofuscadores/Otimizadores de Bytecode

Ofuscamento = otimiza��o?

A efic�cia do ofuscamento

FONTE ORIGINAL

DESCOMPILADO (BYTECODE ORIGINAL)

DESCOMPILADO (BYTECODE OFUSCADO / OP��ES PADR�O)

DESCOMPILADO (BYTECODE OFUSCADO / AGRESSIVAMENTE)

Os cuidados com ofuscadores

Conclus�es

Bibliografia

Saiu na DevMedia!

Saiba mais sobre Java EE ;)

Confira outros conte�dos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para come�ar a atuar como programador?

Por que a programa��o se tornou a profiss�o mais promissora da atualidade?

Quais s�o os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programa��o atrav�s da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem hor�rio para as aulas?

Por que a DevMedia n�o usa videoaulas em sua did�tica?

Preciso de um computador espec�fico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais s�o os planos de assinatura dispon�veis?

Adquirindo o plano, terei acesso a todo o conte�do?

A plataforma tem planos vital�cios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

Como excluir meus dados da plataforma?