Java Garbage Collection Tutorial: Entendendo e otimizando

Por que eu devo ler este artigo:O tema � muito pertinente a qualquer desenvolvedor Java, pois por mais que as consequ�ncias de um processo de Garbage Collection mal configurado n�o apare�am muito em ambiente de desenvolvimento, certamente far�o a diferen�a em ambiente de produ��o, e � importante entender os motivos que levam ao comportamento indesejado do Garbage Collection quando submetido a m�ltiplos processadores e grandes quantidades de dados.

O artigo apresenta conceitos e m�tricas de Garbage Collection em Java, al�m da categoriza��o da mem�ria heap em generations. Em seguida, apresenta a JVM HotSpot 6 e seu funcionamento geral com rela��o � Garbage Collection, assim como a sua personaliza��o atrav�s de op��es da JVM. A partir daqui, explica sobre cada collector, seu funcionamento, suas op��es de personaliza��o e suas implementa��es, fazendo tamb�m um comparativo final mostrando quando � mais adequado utilizar cada um dos collectors dispon�veis. Ainda, apresenta a JVM HotSpot 7 e seu novo collector, seu funcionamento e op��es de personaliza��o.

Um assunto constantemente deixado de lado atualmente, por�m de extrema import�ncia, � a devida configura��o do processo de Garbage Collection. � comum de se ver pouco esfor�o quanto a este respeito, e assim aparecem muitas consequ�ncias que seriam evit�veis em um processo de Garbage Collection bem configurado.

Tipicamente, � incomum ver um desenvolvedor que se preocupe o suficiente com isto, pois � muito prov�vel que seu ambiente de desenvolvimento n�o possua as mesmas necessidades que um ambiente de produ��o, e desta forma ele n�o sente bem os flagelos causados por um Garbage Collection mal configurado: as famigeradas pausas e demoras.

Todavia, � poss�vel otimizar a maioria dos cen�rios, visto que cada aplica��o tem uma maneira �nica quanto � utiliza��o de mem�ria, sendo assim poss�vel buscar as configura��es a serem utilizadas para obter-se o m�ximo poss�vel do processo de Garbage Collection.

A inten��o deste artigo � demonstrar aos desenvolvedores a import�ncia de entender e otimizar o processo de Garbage Collection. Assim, faz-se necess�rio um estudo preliminar sobre os conceitos e algoritmos dispon�veis em diferentes vers�es da Java Virtual Machine (JVM) mais conhecida atualmente, a JVM HotSpot, o que ser� abordado neste primeiro artigo da s�rie �Entendendo e otimizando o Garbage Collection�.

Conceitos de Garbage Collection em Java

A linguagem Java possui gerenciamento autom�tico de mem�ria, controlando sua aloca��o e desaloca��o. A desaloca��o de mem�ria � suportada pelo processo conhecido por Garbage Collection.

Esta abordagem difere-se das linguagens tradicionais como C++, onde a mem�ria din�mica � alocada e desalocada explicitamente, o que costumava ser problem�tico devido � utiliza��o de ponteiros de mem�ria, o que possibilita problemas como vazamentos de mem�ria e bugs de ponteiros para regi�es da mem�ria que continham objetos que j� foram desalocados.

Em Java, a aloca��o e desaloca��o de mem�ria acontece de maneira autom�tica, controlada e transparente ao desenvolvedor, substituindo a utiliza��o de ponteiros de mem�ria por refer�ncias de objetos, evitando assim os vazamentos de mem�ria e bugs de ponteiros. Desta forma, a linguagem Java � considerada mais segura neste aspecto.

Em contrapartida, este gerenciamento autom�tico de mem�ria consome recursos computacionais quanto � decis�o sobre a desaloca��o, fato j� sabido pelo desenvolvedor que realizava isto explicitamente em C++. Al�m disso, este processo � n�o-determin�stico, ou seja, n�o h� garantias sobre quando acontecer� a desaloca��o, se ela vier a acontecer.

Antes de explicar mais detalhes sobre este processo, eis alguns conceitos iniciais:

Mem�ria heap: espa�o reservado pela JVM para a aloca��o de objetos em mem�ria. Toda aloca��o de objeto em Java � realizada na mem�ria heap. Da mesma forma, toda vez que um objeto � desalocado, a mem�ria utilizada por este retorna como mem�ria dispon�vel para a heap;
Collection: processo autom�tico de gerenciamento da mem�ria heap, baseado em duas atividades: busca de objetos que n�o s�o mais acess�veis, e desaloca��o dos recursos utilizados por estes objetos;
Collector: algoritmo que realiza uma collection;
Throughput (vaz�o): porcentagem de tempo de execu��o n�o utilizada em collections, ou seja, teoricamente � o total de tempo de execu��o dispon�vel para a aplica��o, considerado sobre longos per�odos de tempo;
Pausa: momento de tempo onde a aplica��o fica n�o-responsiva porque uma collection est� acontecendo.

Tipicamente, throughput e pausa representam um trade-off em Garbage Collection, ou seja, quanto mais esfor�o se investe em maximizar o throughput, menos se tem em minimizar o tempo de pausa, e vice-versa.

Em determinadas situa��es, a exist�ncia de pausas n�o caracteriza um problema cr�tico, como por exemplo em um servidor web, onde o cliente j� est� ciente que precisar� esperar por uma resposta, e assim as pausas de Garbage Collection podem ser disfar�adas pela lat�ncia de rede, de maneira que o usu�rio n�o consiga perceber que a demora aconteceu por causa de Garbage Collection. Assim, uma boa ideia seria utilizar um collector que busque maximizar o throughput da aplica��o.

Em outras situa��es, a exist�ncia de pausas representa um problema cr�tico, como por exemplo em uma aplica��o gr�fica e interativa, onde mesmo pequenas pausas ser�o percebidas pelo usu�rio e podem afetar sua experi�ncia com a aplica��o. Assim, uma boa ideia seria utilizar um collector que busque minimizar o tempo de pausa.

O gr�fico da Figura 1, obtido do website da Oracle, representa a porcentagem de throughput perdida em aplica��es que gastam diferentes quantidades de tempo com collections, � medida que mais processadores s�o adicionados ao sistema. Por exemplo, a linha vermelha representa uma aplica��o que gasta 1% do tempo fazendo collections e a linha roxa representa outra aplica��o que gasta 10%. Ambas as aplica��es n�o apresentam perda consider�vel de throughput em um sistema com 1 processador, pois no gr�fico ambas as linhas est�o pr�ximas de 1 de throughput quando temos 1 processador. No entanto, quando operam com 32 processadores, a primeira aplica��o apresenta uma perda de mais de 20% de throughput (pois a linha vermelha est� um pouco abaixo de 0.8 quando temos 32 processadores), e a segunda aplica��o possui mais de 75% de throughput perdido (pois a linha roxa est� um pouco acima de 0.2 quando temos 32 processadores).

O objetivo deste gr�fico � demonstrar como quest�es pouco percept�veis em sistemas com um processador podem tornar-se verdadeiros gargalos quando as escalamos a sistemas grandes. No entanto, � poss�vel melhorar este cen�rio com a sele��o do algoritmo mais apropriado de Garbage Collection, al�m da realiza��o de ajustes personalizados.

**Figura 1.** Como o tempo gasto em GC afeta o throughput por processador.

Algoritmo Mark and Sweep

Um objeto � considerado �garbage� quando n�o � mais acess�vel de qualquer refer�ncia do programa em execu��o. O primeiro desafio � identificar tais objetos, para em um segundo momento reclamar a mem�ria previamente ocupada por estes objetos.

O primeiro algoritmo criado para Garbage Collection � conhecido como Mark and Sweep. At� hoje, deriva��es deste algoritmo s�o extensivamente utilizadas.

O algoritmo Mark and Sweep � composto por duas fases: a fase Mark, onde todos os objetos acess�veis do sistema s�o visitados e marcados como tal, e logo depois a fase Sweep, onde todos os objetos que n�o foram marcados como acess�veis s�o reclamados.

Ainda, uma collection que utiliza o algoritmo Mark and Sweep ir� suspender temporariamente a execu��o do programa, enquanto o algoritmo realiza seu trabalho. Assim que todos os objetos n�o referenciados s�o reclamados, a execu��o do programa � retomada. Esta caracter�stica � conhecida como stop the world, ou como diria Raulzito, �pare o mundo que eu quero descer�.

Uma collection que visita todos os objetos acess�veis do sistema � denominada Full Garbage Collection. Em Java, logo se percebe que realizar frequentemente Full Garbage Collections n�o � uma boa ideia, visto o tempo que seria gasto para tal devido a grande quantidade de objetos que s�o criados ao longo da execu��o de cada programa.

Generations

Como uma alternativa ao algoritmo original de Mark and Sweep, surgiram os algoritmos generacionais de Garbage Collection. Estes algoritmos baseiam-se na observa��o que a maioria dos objetos sobrevive por um curto per�odo de tempo. � uma caracter�stica comuns na maioria das aplica��es que pode ser utilizada para minimizar o esfor�o anteriormente gasto pelos algoritmos mais ing�nuos.

A Figura 2, tamb�m obtida do website da Oracle, representa uma distribui��o do tempo de vida m�dio de objetos, onde o eixo X � a quantidade de bytes alocados, e o eixo Y � a quantidade de bytes em execu��o em um determinado momento. Nota-se que ap�s um breve pico, o n�mero de bytes em execu��o cai drasticamente, o que significa que tal soma de objetos foi reclamada pouco tempo ap�s ser alocada. Isto � comum de se ver em objetos que s�o criados para serem utilizados dentro de m�todos curtos e loops. Em contrapartida, alguns objetos permanecem em execu��o por muito tempo, por exemplo objetos presentes em transa��es longas ou acesso a banco de dados.

Assim foi idealizada a no��o de generations (gera��es) de objetos, que servem para dividir os objetos pelo crit�rio �tempo de exist�ncia�. Cada generation representa uma ou mais separa��es f�sicas ou l�gicas do espa�o de mem�ria e possui um determinado limite que, quando atingido, desencadeia uma collection. Confira os tr�s tipos poss�veis de generation:

Young generation(gera��o jovem): cont�m objetos desde sua cria��o at� certo patamar, onde se espera uma queda brusca na quantidade de bytes em execu��o, conforme a Figura 2. Representa de fato a grande maioria dos objetos. Quando esta gera��o alcan�a o seu limite, acontece uma minor collection, ou cole��o menor, onde apenas os objetos pertencentes a Young generation s�o coletados. Tipicamente, minor collections s�o r�pidas, coletam muitos objetos e consomem poucos recursos da JVM;
Tenured generation (>gera��o efetivada): cont�m objetos que sobreviveram a minor collections, o que significa que seu tempo de exist�ncia � significativamente grande. Quando esta gera��o alcan�a o seu limite, acontece uma major collection, ou cole��o maior, onde todos os objetos da mem�ria heap s�o coletados. Tipicamente, major collections s�o pesadas, podem n�o coletar muitos objetos e consomem muitos recursos da JVM;
Permanent generation (gera��o permanente): cont�m objetos necess�rios � execu��o da JVM, como classes, m�todos e interfaces. Esta gera��o tamb�m sofre major collections, embora isto raramente fa�a uma diferen�a significativa.

Collectors da JVM HotSpot 6

A JVM HotSpot, que � fornecida no download do Java Runtime Environment (JRE) ou Java Development Kit (JDK) pelo site da Oracle, em sua vers�o 6.0, possui alguns collectors que s�o estudados a seguir.

Ergonomics

Desde a vers�o 5.0, a JVM HotSpot possui uma funcionalidade conhecida como Ergonomics, que � a escolha autom�tica de certas op��es de linha de comando na inicializa��o da JVM. Esta escolha � baseada no porte da m�quina na qual a JVM est� rodando, o que sugere caracter�sticas da aplica��o. Por exemplo: aplica��es mais pesadas devem rodar em m�quinas mais potentes.

De maneira geral, Ergonomics seleciona:

O algoritmo de Garbage Collection;
O tamanho da mem�ria heap;
O compilador de tempo de execu��o.

Tal escolha autom�tica de um algoritmo de Garbage Collection geralmente resulta em ganhos de performance, mas n�o � poss�vel garantir que esta seja a melhor escolha poss�vel. Certos tipos de aplica��o que possuam uma utiliza��o de mem�ria muito particular podem necessitar de escolhas expl�citas para alcan�ar o n�vel de performance esperado.

Funcionamento geral

A JVM HotSpot 6 divide a mem�ria heap conforme a Figura 3, obtida do blog about:performance.

**Figura3.** Divis�o da mem�ria heap na JVM HotSpot 6.

Nesta divis�o, a Young generation � novamente dividida em tr�s peda�os: espa�o Eden, onde a maioria dos objetos � inicialmente alocada, e dois espa�os Survivor, onde objetos s�o copiados ao sobreviver a collections.

Tipicamente, objetos em Eden que sobreviveram � primeira collection s�o copiados a um dos espa�os Survivor, e a cada nova collection que sobreviverem continuar�o a ser copiados entre os espa�os Survivor, at� serem considerados maduros o suficiente para serem copiados para a Tenured generation. O objetivo ap�s a c�pia � sempre deixar Eden e um dos espa�os Survivor vazios. Esta forma de Garbage Collection � conhecida como copy collection.

Na Tenured generation, n�o h� c�pia, mas sim libera��o de mem�ria, por algoritmos tipicamente derivados de Mark and Sweep. No entanto, quando h� libera��o de mem�ria, fica-se sujeito a problemas de fragmenta��o de mem�ria.

Em termos de mem�ria heap, fragmenta��o causa aloca��o lenta, longa dura��o da fase Sweep e possibilidade de OutOfMemoryError quando os espa�os entre objetos s�o menores que o suficiente para a aloca��o de novos objetos, conforme demonstrado na Figura 4, obtida do blog about:performance.

Para tal, � necess�rio mais uma fase, chamada de Compact, onde � realizada a desfragmenta��o pela compacta��o do espa�o dispon�vel na mem�ria heap, tamb�m demonstrado na Figura 4.

Fragmenta��o da mem�ria heap
e seu estado ap�s a compacta��o — **Figura4.** Fragmenta��o da mem�ria *heap* e seu estado ap�s a compacta��o.

Configurando a JVM HotSpot

Antes de entrar no estudo minucioso dos collectors da JVM HotSpot, � importante apresentar algumas op��es da JVM para personalizar a configura��o da mem�ria heap e as generations:

-Xms<N>: Especifica o tamanho inicialmente reservado da mem�ria heap em N megabytes;
-Xmx<N>: Especifica o tamanho m�ximo da mem�ria heap em N megabytes;
-XX:MinHeapFreeRatio=<N>: Especifica a porcentagem m�nima de espa�o livre da mem�ria heap. Se o espa�o livre vier a ser menor que N%, o tamanho da mem�ria heap ser� aumentado para garantir esta porcentagem de espa�o livre m�nimo;
-XX:MaxHeapFreeRatio=<N>: Especifica a porcentagem m�xima de espa�o livre da mem�ria heap. Se o espa�o livre vier a ser maior que N%, o tamanho da mem�ria heap ser� diminu�do para garantir esta porcentagem de espa�o livre m�ximo;
-XX:NewRatio=<N>: Especifica a propor��o de tamanho 1:N entre Young generation e o resto da mem�ria heap. Por exemplo, se N=3, ent�o a propor��o ser� 1:3, ou seja, a Young generation ocupar� 1/4 do espa�o total da mem�ria heap;
-XX:NewSize=<N>: Especifica o tamanho inicialmente reservado da Young generation em N megabytes. � uma alternativa a -XX:NewRatio pois pode ser dif�cil estimar este tamanho em propor��o 1:N;
-XX:MaxNewSize=<N>: Especifica o tamanho m�ximo da Young generation em N megabytes;
-XX:SurvivorRatio=<N>: Especifica a propor��o de tamanho 1:N entre cada espa�o Survivor e Eden. Por exemplo, se N=6, ent�o a propor��o ser� 1:6, ou seja, cada espa�o Survivor ocupar� 1/8 do espa�o total da Young generation (pois h� dois espa�os Survivor);
-XX:PermSize=<N>: Especifica o tamanho inicialmente reservado da Permanent generation em N megabytes;
-XX:MaxPermSize=<N>: Especifica o tamanho m�ximo da Permanent generation em N megabytes.

Al�m disto, h� as seguintes op��es para imprimir logs sobre Garbage Collection:

-verbosegc: Imprime uma linha no console a cada collection realizada, no formato [GC <tamanho da mem�ria heap antes da collection> -> <tamanho da mem�ria heap ap�s a collection> (<tamanho m�ximo da mem�ria heap>), <tempo de pausa> secs];
-XX:+PrintGCDetails: Similar a -verbosegc, mas inclui mais informa��es como os detalhes da execu��o de cada collector;
-XX:+PrintGCTimeStamps: Quando usado com -XX:+PrintGCDetails mostra os hor�rios em que cada collection foi realizada;
-XX:+PrintGCDateStamps: Quando usado com -XX:+PrintGCDetails mostra as datas em que cada collection foi realizada;
-XX:+PrintReferenceGC: Quando usado com -XX:+PrintGCDetails mostra estat�sticas de objetos de refer�ncia fraca, como WeakReference, SoftReference e PhantomReference;
-XX:+PrintTenuringDistribution: Imprime uma linha no console a cada collection realizada a respeito da utiliza��o dos espa�os Survivor e um threshold indicando quantas vezes um objeto pode ser copiado dentro da Young generation antes de ser considerado apto para pertencer � Tenured generation.

A JVM HotSpot 6 at� a update 13 possui tr�s collectors de Garbage Collection: Serial, Parallel e Concurrent, que ser�o estudados a seguir.

Serial

O collector Serial foi a escolha padr�o da JVM at� surgir Ergonomics (antes do Java 5), e hoje continua sendo a escolha certa para a maioria das aplica��es pequenas.

� baseado em uma �nica thread para realizar todo o trabalho de Garbage Collection. Por um lado, isto � vantajoso devido ao fato que n�o h� gasto de processamento com sincroniza��o e comunica��o entre threads, mas por outro lado � desvantajoso pois n�o aproveita de fato a utiliza��o de m�ltiplos processadores quando os mesmos existem no hardware atual.

Assim sendo, o collector Serial � mais adequado em m�quinas com �nico processador, ou m�quinas com m�ltiplos processadores que processem uma quantidade pequena de dados (at� aproximadamente 100 MB).

O ponto fraco deste algoritmo � o tamanho da pausa, que tende a ser muito grande comparado aos outros algoritmos dispon�veis.

Outra quest�o a ser observada � relacionada com a Lei de Amdahl. Segundo a Lei de Amdahl, o ganho de performance na utiliza��o de m�ltiplos processadores � limitado pela fra��o de tempo no qual o processamento paralelo pode ser utilizado.

Em outras palavras, sempre que houver uma por��o de c�digo que n�o pode ser paralelizado (como um m�todo synchronized, por exemplo), o tempo dispon�vel para o processamento paralelo ser� menor, e assim o ganho de performance diminuir�. Assim, outro fator a favor da utiliza��o do collector Serial � quando uma aplica��o possui muito c�digo n�o-paraleliz�vel.

H� duas implementa��es deste collector:

Serial: atua na Young generation utilizando uma �nica thread. � do tipo copy collector (copia os objetos alcan��veis para outra regi�o da mem�ria heap, como um dos espa�os Survivor ou a Tenured generation, e libera a mem�ria da regi�o toda);
SerialOld: atua na Tenured generation utilizando uma �nica thread. � do tipo mark-sweep-compact (marca os objetos inalcan��veis, libera a mem�ria e em seguida a compacta).

O collector Serial pode ser explicitamente escolhido utilizando a op��o da JVM: -XX:UseSerialGC. Esta op��o seleciona as implementa��es Serial (para Young generation) e SerialOld (para Tenured generation).

Parallel

O collector Parallel (tamb�m conhecido como collector Throughput) realiza collections em paralelo, otimizando o tempo de processamento significativamente. O objetivo deste collector � maximizar o throughput da aplica��o, abrindo m�o de minimizar o tempo de pausa, apesar de que as pausas s�o significantemente menores que o collector Serial em m�quinas com m�ltiplos processadores. Foi projetado para trabalhar com quantidade m�dia a grande de dados.

H� tr�s implementa��es deste collector:

Parallel Scavenge: atua na Young generation utilizando v�rias threads e � do tipo copy collector;
ParNew: tamb�m atua na Young generation utilizando v�rias threads e � do tipo copy collector. Seu diferencial � que foi otimizado para o uso com o collector Concurrent;
Parallel Old: atua na Tenured generation utilizando v�rias threads e � do tipo compacting collector (algoritmo derivado de Mark and Sweep que realiza compacta��o ao mesmo tempo em que opera).

Uma particularidade da implementa��o Parallel Old � que ele n�o compacta toda a regi�o Tenured collection todas as vezes, apenas compacta a sub-regi�o que necessite mais.

O collector Parallel pode ser explicitamente escolhido utilizando uma entre as seguintes op��es da JVM:

-XX:UseParallelGC: seleciona as implementa��es Parallel Scavenge (para Young generation) e Serial Old (para Tenured generation);
-XX:UseParNewGC: seleciona as implementa��es ParNew (para Young generation) e Serial Old (para Tenured generation);
-XX:UseParallelOldGC: seleciona as implementa��es Parallel Scavenge (para Young generation) e Parallel Old (para Tenured generation).

� poss�vel personalizar seu funcionamento com as seguintes op��es da JVM:

-XX:ParallelGCThreads=<N>: Especifica o n�mero de threads e Garbage Collection a serem utilizadas. Por padr�o, o collector Parallel utilizar� X threads de Garbage Collection em uma m�quina com X processadores. Tipicamente, em uma m�quina com 1 processador, o collector Parallel ter� performance pior que o collector Serial. Em uma m�quina com 2 processadores ou mais, com uma quantidade m�dia a grande de dados, o collector Parallel j� se sobressai;
-XX:MaxGCPauseMillis=<N>: Especifica a pausa m�xima desejada. Por padr�o, n�o h� pausa m�xima desejada previamente definida.

A utiliza��o desta op��o faz com que o tamanho da mem�ria heap e outros par�metros sejam ajustados para tentar manter as pausas menores ou iguais a N milissegundos, podendo assim afetar o throughput da aplica��o. Contudo, n�o h� garantias que o tempo de pausa ser� menor ou igual a N milissegundos em todas as execu��es;
-XX:GCTimeRatio=<N>.: Especifica a raz�o de tempo total para Garbage Collection na aplica��o, segundo a f�rmula 1 / (1 + <N>). Por exemplo, -XX:GCTimeRatio=19 define a raz�o de 1/20 ou 5% como o tempo total para Garbage Collection na aplica��o;
-XX:YoungGenerationSizeIncrement=<Y>.: Especifica a porcentagem de incremento quando o tamanho da Young generation aumenta. Por padr�o, � 20%;
-XX:TenuredGenerationSizeIncrement=<T>.: Especifica a porcentagem de incremento quando o tamanho da Tenured generation aumenta. Por padr�o, � 20%;
-XX:AdaptiveSizeDecrementScaleFactor=<D>.: Especifica o fator D para calcular a porcentagem de decremento quando o tamanho de alguma generation diminui. Tal porcentagem � calculada como X / D, onde X � a porcentagem de incremento. Por padr�o, a porcentagem de decremento � 5%;
-XX:DefaultInitialRAMFraction=<N>: Especifica o fator N para calcular o tamanho inicial da mem�ria heap, que � igual a R / N, onde R � o tamanho da mem�ria RAM da m�quina. Por padr�o, N � 64;
-XX:DefaultMaxRAMFraction=<N>: Especifica o fator N para calcular o tamanho m�ximo da mem�ria heap, que � calculada como o valor m�nimo entre 1 GB ou R / N, onde R � o tamanho da mem�ria RAM da m�quina. Por padr�o, N � 4;
-XX:-UseGCOverheadLimit: Desabilita o disparo de OutOfMemoryError quando mais de 98% do tempo total � usado em Garbage Collection, sobrando menos de 2% para a aplica��o.

Concurrent (CMS)

O collector Concurrent (tamb�m conhecido como CMS, que significa Concurrent Mark and Sweep) tamb�m realiza collections em paralelo, assim como o collector Parallel. O objetivo deste collector � minimizar o tempo de pausa, mesmo que as pausas aconte�am com maior frequ�ncia, abrindo m�o de maximizar o throughput da aplica��o. Foi projetado para aplica��es que necessitem ter um baixo tempo de pausa, e que al�m disso utilizem quantidade m�dia a grande de dados que permane�am um bom tempo em execu��o (formando assim uma grande Tenured generation).

Uma particularidade deste collector � que a maior parte do processo de Garbage Collection acontece ao mesmo tempo em que a aplica��o � executada. Desta forma, haver� um maior consumo de processamento, o que poder� afetar o throughput.

O processo ocorre da seguinte maneira:

Pausa para marca��o inicial: todas as threads da aplica��o s�o suspensas para a marca��o do primeiro n�vel de objetos alcan��veis a partir das ra�zes (objetos diretamente acess�veis pela mem�ria heap). Esta pausa � breve, e n�o utiliza m�ltiplas threads;
Marking em concorr�ncia: as threads da aplica��o s�o retomadas, e inicia-se concorrentemente o processo de navega��o e marca��o dos objetos alcan��veis pelos objetos marcados na etapa anterior. N�o � garantido que todos os objetos alcan��veis da mem�ria heap ser�o marcados nesta etapa, pois uma vez que este processo � concorrente com a aplica��o, novos objetos podem ter sido criados a partir de objetos que j� foram visitados desde o in�cio desta etapa, e assim acabam ficando sem serem marcados como alcan��veis;
Pausa para remarca��o: todas as threads da aplica��o s�o suspensas novamente, e agora todos os objetos alcan��veis s�o revisitados para a marca��o de novos objetos alcan��veis que n�o foram visitados na marca��o inicial. Eventuais objetos que foram marcados inicialmente mas agora se tornaram inalcan��veis permanecer�o marcados, mas ser�o coletados na pr�xima collection. Esta pausa � consideravelmente maior que a pausa inicial, e pode utilizar m�ltiplas threads;
Sweeping em concorr�ncia: as threads da aplica��o s�o retomadas, e inicia-se concorrentemente o processo de sweeping da mem�ria heap.

Por ter este funcionamento, o collector Concurrent n�o realiza compacta��o. Desta forma, fica-se sujeito � fragmenta��o de mem�ria, que pode gerar um problema de aloca��o quando o espa�o dispon�vel entre os blocos de mem�ria � insuficiente para a aloca��o de um objeto. Quando isto acontecer, entrar� em a��o um outro collector que realizar� uma Major collection com direito a compacta��o da mem�ria heap no final de seu ciclo.

O collector Concurrent pode ser explicitamente escolhido utilizando a op��o da JVM: -XX:UseConcMarkSweepGC. Esta op��o seleciona as implementa��es ParNew (para Young generation), CMS e Serial Old (ambos para Tenured generation). Neste caso, primeiramente tentar� utilizar CMS, mas se houver problemas de fragmenta��o, utilizar� Serial Old.

� poss�vel personalizar seu funcionamento com a seguinte op��o da JVM:

-XX:CMSInitiatingOccupancyFraction=<N>: Especifica a porcentagem de ocupa��o da Tenured generation necess�ria para disparar uma collection. Por padr�o, este valor � aproximadamente 92%.

Incremental Concurrent (i-CMS)

O collector Concurrent possui um modo onde as fases concorrentes acontecem de forma incremental, chamado de Incremental Concurrent (tamb�m conhecido como i-CMS ou Train). Neste modo, quando m�ltiplas threads est�o trabalhando no processo de Garbage Collection, o trabalho a ser feito � dividido em pequenas por��es que s�o agendadas para acontecer entre Minor collections. Foi projetado para oferecer baixo tempo de pausa sem consumir muito throughput, sendo ideal para m�quinas com n�mero pequeno de processadores (como 1 ou 2).

Uma particularidade deste modo � o uso de duty cycle para controlar a quantidade de trabalho que deve ser realizado antes do collector devolver o processador para a aplica��o. Duty cycle � a porcentagem de tempo de Minor collections que este collector pode utilizar.

O processo ocorre da seguinte maneira:

Pausa para marca��o inicial: id�ntico ao CMS, onde todas as threads da aplica��o s�o suspensas para a marca��o de todos os objetos alcan��veis a partir das ra�zes;
Marking em concorr�ncia: id�ntico ao CMS, as threads da aplica��o s�o retomadas, e inicia-se concorrentemente o processo de navega��o e marca��o de objetos alcan��veis usando um ou mais processadores;
Remarking em concorr�ncia: separa-se um processador para fazer a remarca��o concorrente dos objetos que foram modificados desde a etapa anterior;
Pausa para remarca��o: todas as threads da aplica��o s�o suspensas novamente, e agora todos os objetos alcan��veis que foram modificados desde a �ltima vez que foram examinados s�o revisitados para marca��o;
Sweeping em concorr�ncia: as threads da aplica��o s�o retomadas, e inicia-se concorrentemente o processo de sweeping da mem�ria heap, usando um processador;
Resizing em concorr�ncia: redimensiona o tamanho da mem�ria heap e prepara as estruturas de dados para a pr�xima collection, usando um processador.

O collector Incremental Concurrent pode ser explicitamente escolhido utilizando as op��es da JVM: -XX:UseConcMarkSweepGC e -XX:+CMSIncrementalMode. Estas op��es selecionam as implementa��es ParNew (para Young generation), i-CMS e Serial Old (ambos para Tenured generation). Novamente, primeiramente tentar� utilizar i-CMS, mas se houver problemas de fragmenta��o, utilizar� Serial Old.

� poss�vel personalizar seu funcionamento com as seguintes op��es da JVM:

-XX:+CMSIncrementalPacing: Habilita automatic pacing, que � a estimativa autom�tica do duty cycle baseado em estat�sticas da JVM. Por padr�o, � habilitado;
-XX:+CMSIncrementalDutyCycle=<N>: Especifica a porcentagem de tempo entre Minor collections quando o collector pode executar. Se automatic pacing est� habilitado, especifica apenas o valor inicial. Por padr�o, � 10;
-XX:CMSIncrementalSafetyFactor=<N>: Especifica a porcentagem de uma margem de seguran�a que ser� adicionada ao tempo de execu��o das Minor collections. Por padr�o, � 10;
-XX:CMSIncrementalOffset=<N>: Especifica a porcentagem na qual o duty cycle tem seu in�cio intencionalmente atrasado. Por padr�o, � 0;
-XX:CMSExpAvgFactor=<N>: Especifica a porcentagem usada para pesar a amostra atual quando computar m�dias exponenciais para as estat�sticas de collections concorrentes. Por padr�o, � 25.

Escolhendo o melhor collector

Conforme j� discutido, o melhor collector para uma aplica��o depende de v�rios fatores, como o porte da m�quina a ser utilizada, a maneira que a aplica��o utiliza a mem�ria heap em termos de aloca��o, o tempo de vida dos objetos, a import�ncia de maximizar o throughput ou minimizar o tempo de pausa, entre outros fatores. Assim, � necess�rio um estudo mais aprofundado para identific�-lo.

No entanto, � proposto aqui um ponto de partida para identificar o collector mais adequado. Em seguida, sugere-se analisar o tempo gasto com collection por meio de op��es da JVM, realizar testes de performance e testar diferentes configura��es buscando cada vez mais otimiza��o.

A Figura 5 resume os intervalos de pausa entre os tr�s collectors apresentados. Cada seta representa uma thread; as setas de cor azul s�o threads da aplica��o e as setas de cor laranja s�o threads de collectors.

Detalhamento das pausas nos collectors
Serial, Parallel e Concurrent — **Figura5.** Detalhamento das pausas nos *collectors Serial, Parallel* e *Concurrent*.

Como regra geral, a menos que seja muito importante ter um tempo de pausa baixo, � recomendado primeiramente deixar a JVM escolher e configurar o collector a ser utilizado atrav�s de Ergonomics.

Se a performance n�o estiver suficiente, recomenda-se o seguinte:

Se a aplica��o possuir uma quantidade de dados pequena (at� aproximadamente 100 MB), utilize o collector Serial;
Se a aplica��o for executada em um �nico processador e n�o houver restri��es quanto ao tempo de pausa, utilize o collector Serial;
Se for prioridade explorar o m�ximo poss�vel de performance e pausas de um segundo ou mais forem aceit�veis, deixe a JVM selecionar o collector ou utilize o collector Parallel;
Se o tempo de resposta for mais importante que o throughput e pausas devam ser menores que um segundo, utilize o collector Concurrent. Se, al�m disso, apenas um ou dois processadores estiverem dispon�veis, utilize o collector Incremental Concurrent.

Note que estas recomenda��es n�o garantem que os tempos de pausa sempre ser�o menores que um segundo ou que o throughput sempre ser� alto, visto que a JVM HotSpot � n�o-determin�stica, ou seja, ela trabalha buscando uma boa combina��o geral de fatores a troco de abstrair certos detalhes internos do programador. Para ter garantias reais, � necess�rio utilizar outros tipos de JVM, como por exemplo, as que implementem a JSR-1, tamb�m conhecida como Real-Time Specification for Java (RTSJ).

Se o collector recomendado n�o alcan�ar a performance desejada, a primeira personaliza��o a ser feita � o ajuste do tamanho da mem�ria heap. Al�m disso, pode-se alterar os tamanhos das generations. Este � um fator muito sens�vel, pois uma Young generation muito grande pode aumentar o throughput mas prejudicar o tempo de pausa, visto que as collections que acontecerem nesta generation demorar�o mais. Em contrapartida, uma Young generation muito pequena diminuir� o tempo de pausa, mas prejudicar� o throughput.

Se ainda assim n�o houver sucesso com rela��o � performance, busque utilizar o collector Concurrent para reduzir tempos de pausa e o collector Parallel para aumentar o throughput em uma m�quina com m�ltiplos processadores.

Collectors da JVM HotSpot 7

A JVM HotSpot 7 basicamente manteve os collectors Serial e Parallel, por�m decidiu substituir Concurrent por Garbage First, um novo collector considerado como o pr�ximo est�gio de evolu��o dos algoritmos generacionais, ao menos em teoria.

Garbage First

O collector Garbage First (tamb�m conhecido como G1) � generacional e realiza collections em paralelo, assim como seus antecessores Parallel e Concurrent. O objetivo deste collector � possibilitar simultaneamente alto throughput e alta probabilidade de cumprir tempos de pausa pr�-definidos (Garbage First �, portanto considerado um collector suave de tempo real). Foi projetado para sistemas com m�ltiplos processadores e com grande quantidade de mem�ria.

Para alcan�ar seu objetivo, o collector Garbage First particiona fisicamente a mem�ria heap em regi�es de mesmo tamanho. Deste modo a separa��o entre generations � meramente l�gica. Algumas regi�es ser�o atribu�das a Young generation, outras ser�o a Tenured e as restantes a Permanent.

Assim como Concurrent, Garbage First possui uma fase de marca��o concorrente, onde busca identificar as regi�es cheias de objetos n�o-alcan��veis, que seriam idealmente coletadas primeiro. Para tal, � calculado o �ndice de liveliness destas regi�es, o que representa a quantidade de objetos alcan��veis que cada regi�o cont�m no momento.

O processo de collection � feito atrav�s de pausas para evacuation, onde Garbage First seleciona determinadas regi�es, identifica os objetos sobreviventes dentro destas regi�es, os copia para outras regi�es e finalmente reclama o espa�o total das regi�es primeiramente selecionadas. Ao selecionar regi�es, d� prioridade �quelas com menor liveliness, ou seja, com mais objetos a serem coletados. Seu nome Garbage First surgiu por causa desta ideia, que busca maximizar a quantidade de objetos coletados por cada execu��o de collection, o que significa uma otimiza��o no processo convencional de collection.

A maioria das pausas para evacuation coleta regi�es pertencentes � Young generation, tal como os outros collectors, mas por vezes algumas regi�es pertencentes � Tenured generation s�o tamb�m selecionadas junto com as primeiras para serem coletadas na mesma pausa para evacuation.

Outra particularidade � a respeito de Garbage First conseguir cumprir tempos de pausa pr�-definidos com alta probabilidade de acerto, devido ao fato que a granularidade das collections � por regi�o e n�o por generation, tendo desta forma objetivos menores e menos propensos a atrasos. � muito mais preciso estimar o tempo de collection de uma regi�o em compara��o a toda a generation, e assim Garbage First utiliza esta estimativa para decidir quantas regi�es dever�o ser coletadas para cumprir o tempo de pausa desejado pelo usu�rio. Al�m disso, Garbage First tem autoriza��o para diminuir um pouco o throughput em favor do cumprimento mais preciso deste tempo de pausa.

O collector Garbage First visa substituir Concurrent por resolver dois problemas que o �ltimo possui: fragmenta��o e baixo determinismo com rela��o ao tempo de pausas (pois quando a fragmenta��o chega ao seu limite, ser� necess�rio chamar um collector como SerialOld para coletar e compactar a mem�ria heap toda, ocorrendo inesperadamente um tempo de pausa muito alto). O primeiro problema � resolvido por compacta��o, visto que Garbage First � um compacting collector, e o segundo problema � resolvido pela carga menor de trabalho de cada collection, visto que apenas determinadas regi�es s�o coletadas por vez.

Garbage First foi introduzido na JVM HotSpot 6 update 14 de forma experimental e pode ser explicitamente escolhido utilizando as op��es da JVM: -XX:+UnlockExperimentalVMOptions -XX:+UseG1GC. Na JVM HotSpot 7 apenas o segundo par�metro � necess�rio.

� poss�vel personalizar seu funcionamento com as seguintes op��es da JVM:

-XX:MaxGCPauseMillis=<P>: Especifica o tempo de pausa m�ximo desejado, em milissegundos;
-XX:GCPauseIntervalMillis=<I>: Especifica o intervalo desejado de tempo de execu��o da aplica��o que permitir� o tempo de pausa m�ximo especificado acima, em milissegundos. Por exemplo, se I=200ms e P=20ms, significa que a cada 200ms de execu��o da aplica��o, o collector dever� utilizar no m�ximo 20ms de tempo de pausa;
-XX:+G1YoungGenSize=<N>: Especifica o tamanho da Young generation, em megabytes;
-XX:+G1ParallelRSetUpdatingEnabled -XX:+G1ParallelRSetScanningEnabled: Estes par�metros permitem aproveitar o m�ximo poss�vel de Garbage First, mas, no entanto podem produzir uma rara situa��o de concorr�ncia chamada condi��o de corrida (race condition) e resultar em erro.

Um �ltimo detalhe � que Garbage First � muito mais verboso que os outros collectors da JVM HotSpot quando utilizando a op��o -XX:+PrintGCDetails, pois pretende fornecer mais informa��es para troubleshooting.

Conclus�o

Este artigo visou demonstrar que, embora apresentem diferen�as marcantes, os collectors da JVM HotSpot buscam resolver o mesmo problema, por�m apresentando certas especialidades adequadas a determinados cen�rios. Basta saber identificar o collector mais adequado, experiment�-lo e analisar seu desempenho a fim de otimizar seu funcionamento por meio de op��es da JVM. � tamb�m importante verificar se todos os objetivos de um determinado collector est�o em conformidade com as necessidades do cen�rio em quest�o.

A seguir, as pr�ximas partes desta sequ�ncia de artigos pretendem explorar collectors de outras JVMs, em particular as JVMs de tempo real; apresentar como desenvolver c�digo para otimizar a utiliza��o de mem�ria e facilitar a vida do collector; e como analisar a situa��o da mem�ria heap e do Garbage Collection por meio de ferramentas especializadas. At� breve!

Links

Saiba mais Pr�ximo: JVMs Oracle JRockit,IBM Virtual Machine for Java,JSR-1 e Dalvik

Confira tamb�m

Cursos de Java

Cursos

Guias de Java

Guia

Garbage Collector na JVM

Artigo

// 25 ANOS FORMANDO PROGRAMADORES

APRENDA A

PROGRAMAR DE VERDADE

Um caminho claro do zero ao avan�ado, com pr�tica de verdade.

Voc� constr�i projetos reais desde o come�o e sai sabendo programar sozinho, sem copiar c�digo de professor.

Forma��es completas

+40 Projetos

+5000 exerc�cios

+40 Tecnologias

Mentorias individuais

Suporte com IA

Comunidade de alunos

QUERO COME�AR AGORA

Confira outros conte�dos:

Por Tiago Em 2012

Garbage Collection: Entendendo e otimizando - Parte 1

O artigo trata de explicar fundamentos e detalhes sobre o processo de Garbage Collection em Java, apresentar o funcionamento dos collectors da JVM HotSpot 6 e 7 e como otimizar seu comportamento por meio de op��es da JVM.

Guia do artigo:

Conceitos de Garbage Collection em Java

Algoritmo Mark and Sweep

Generations

Collectors da JVM HotSpot 6

Ergonomics

Funcionamento geral

Configurando a JVM HotSpot

Serial

Parallel

Concurrent (CMS)

Incremental Concurrent (i-CMS)

Escolhendo o melhor collector

Collectors da JVM HotSpot 7

Garbage First

Conclus�o

Links

Confira tamb�m

Cursos de Java

Guias de Java

Garbage Collector na JVM

Confira outros conte�dos: