Processamento Batch em JavaEE 7

Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

As aplica��es Batch para a plataforma Java est�o especificadas na JSR 352. A especifica��o completa pode ser baixada no site da Oracle.

Um processamento em Batch � a execu��o de uma s�rie de jobs ou tarefas sendo adequado para ambientes que n�o precisem de interatividade, e que possua tarefas de longa execu��o. Exemplos t�picos para esse tipo de processamento s�o: gera��o de dados consolidados no final do m�s, c�lculos de interesse de uma organiza��o ao final do dia, carga de dados e o processo de ETL (extract-transform-load) em um data warehouse. Essas tarefas s�o computacionalmente intensivas, executam sequencialmente ou em paralelo, e podem ser iniciadas atrav�s de v�rios modelos de invoca��o como ad hoc, agendada ou sob demanda.

A especifica��o tamb�m define um modelo de programa��o para aplica��es batch e um runtime utilizado para agendamento e execu��o de jobs.

J� viu o checklist de Java da DevMedia? N�o perca tempo!

Segue abaixo alguns dos principais conceitos dessa arquitetura:

Um job � definido como uma entidade que encapsula um processo batch inteiro. Um job � tipicamente colocado junto com um Job Specification Language e consiste de uma ou mais etapas ou steps. Como veremos no decorrer do artigo um Job Specification Language na plataforma JavaEE 7 � implementado com XML e � referenciado como �Job XML�.
Um step � um objeto do dom�nio que encapsula uma fase independente e sequencial de um job. Um step cont�m tudo que � necess�rio para definir e controlar o processamento do batch atual.
O JobOperator fornece uma interface para gerenciar todos os aspectos do processamento de um job, incluindo comandos operacionais como start, restart e stop, al�m de comandos de reposit�rio para jobs.
Um JobRepository cont�m informa��es sobre jobs sendo executados e jobs que foram executados no passado. O JobOperator fornece acesso a este reposit�rio.
O padr�o "Reader-Processor-Writer" � o padr�o prim�rio e usa o estilo de processamento orientado a bloco, na qual ItemReader � uma abstra��o que representa a recupera��o de uma entrada para um step, ItemProcessor � uma abstra��o que representa o processamento de neg�cio de um item, e ItemWriter � uma abstra��o que representa a sa�da de um step.

Veremos no restante do artigo como se d� o funcionamento dos batches na plataforma JavaEE 7 e outros conceitos relacionados.

Processamento Orientado Por Bloco (Chunk-Oriented)

O processamento Orientado Por Bloco (Chunk-Oriented) � o padr�o prim�rio para processamento em Batch na especifica��o. Este padr�o � orientado a um item de processamento onde m�ltiplos itens s�o lidos e processados para criar "peda�os" que s�o ent�o escritos na sa�da, tudo dentro de uma �nica transa��o. Assim, temos que neste tipo de processamento procura-se quebrar um grande processo em pequenos peda�os ou blocos (ou chunks).

A interface ItemReader � usada para ler um fluxo de itens, sendo um item por vez. Um ItemReader fornece um indicador quando n�o h� mais itens a serem fornecidos. A interface ItemProcessor opera em um item de entrada e produz um item de sa�da atrav�s da transforma��o ou da aplica��o de outros processos de neg�cios. Um ItemProcessor entrega o item processado ao ItemWriter para agrega��o. A interface ItemWriter � utilizada para escrever um fluxo de "peda�os" de itens agregados.

Geralmente, um item escritor n�o tem conhecimento das pr�ximas informa��es que ele receber�, apenas do item atual.

As classes abstratas AbstractItemReader e AbstractItemWriter fornecem implementa��es para m�todos menos comumente implementados.

Um registro de entrada pode ser definido da mesma maneira que a apresentada na Listagem 1.

Listagem 1. Exemplo de defini��o de um registro de entrada.


  public class MeuRegistroEntrada {
                  private String s;
   
                  public MeuRegistroEntrada() { }
   
                  public MeuRegistroEntrada(String s) {
                                 this.s = s;;
                  }
   
                  //Mais c�digos aqui
   
  }

MeuRegistroEntrada definido acima � um item que � lido da fonte de entrada.

Um registro de sa�da pode ser definido da mesma maneira que a apresentada na Listagem 2.

Listagem 2. Exemplo de defini��o de um registro de sa�da.


  public class MeuRegistroSaida {
                  private String s;
   
                  public MeuRegistroSaida() { }
   
                  public MeuRegistroSaida(String s) {
                                 this.s = s;
                  }
   
                  //Mais c�digos aqui
   
  }

MeuRegistroSaida � um item que � gerado ap�s o processamento de um item.

As classes MeuRegistroEntrada e MeuRegistroSaida parecem ser muito semelhantes neste caso, no entanto eles poderiam ser bem diferentes dependendo da aplica��o.

Um Job XML � usado para definir um chunk de um step, ou literalmente um peda�o de uma etapa, conforme podemos verificar no exemplo da Listagem 3.

Listagem 3. Exemplo de um Job XML definindo um chunk e um step com seus respectivos atributos.


  <job id="meuJob" xmlns="http://xmlns.jcp.org/xml/ns/javaee" version="1.0">
                  <step id="meuStep">
                                 <chunk item-count="3">
                                                 <reader ref="meuLeitorDeItem"/>
                                                 <processor ref="meuProcessadorDeItem"/>
                                                 <writer ref="meuEscritorDeItem"/>
                                 </chunk>
                  </step>
  </job>

Neste c�digo podemos verificar que o elemento job identifica um job que tem um nome l�gico (id) usado para identifica��o. Um job pode conter qualquer n�mero de etapas identificadas pelo elemento "step". Cada "step" tem um nome l�gico (id) usado para identifica��o. O elemento "chunk" define um peda�o da etapa. Este peda�o � periodicamente verificado de acordo com uma pol�tica de verifica��o configurada. Por padr�o, a pol�tica de verifica��o � o "item", o que significa que o chunk � verificado ap�s um determinado n�mero de itens lidos/processados/escrito. Podemos especificar um valor "customizado" usando o atributo "checkpoint-policy". O "item-count" especifica o n�mero de itens a serem processados por "chunk". O valor padr�o � 10. Este atributo � ignorado para a pol�tica de verifica��o customizada. Tamb�m podemos usar o atributo �item-count� para definir os limites da transa��o. Al�m disso, temos neste c�digo o meuLeitorDeItem que � identificado como o leitor, sendo que o seu valor � o nome do bean CDI de uma classe que implementa a interface ItemReader ou estende a classe abstrata AbstractItemReader. Tamb�m temos o meuProcessadorDeItem que � identificado como o processador, sendo seu valor o nome do bean CDI de uma classe que implementa a interface ItemProcessor. Este elemento � opcional. Se este item n�o for especificado, ent�o todos os elementos do item leitor s�o passados para o item escritor para agrega��o. Por fim, meuEscritorDeItem � identificado como o escritor, sendo que o seu valor � o nome do bean CDI de uma classe que implementa a interface ItemWriter ou estende a classe AbstractItemWriter.

O leitor de item � uma implementa��o da interface ItemReader ou estende a classe AbstractItemReader conforme exemplificado na Listagem 4.

Listagem 4. Exemplo de um leitor de item.


  @Named
  public class MeuLeitorDeItem extends AbstractItemReader {
   
                  List<String> list;
                  
                  @Override
                  public void open(Serializable c) throws Exception {
                                 list = ...
                  }
   
                  @Override
                  public MeuRegistroEntrada readItem() {
                                 for (String s : list) {
                                                 return new MeuRegistroEntrada(s);
                                 }
                                 return null;
                  }
   
  }

Neste c�digo tornamos MeuLeitorDeItem um leitor de item apenas estendendo a classe AbstractItemReader. Entre os m�todos utilizados e sobrescritos temos o m�todo open que prepara o leitor para ler itens. Neste m�todo List � inicializado e o par�metro de entrada "c" representa a �ltima verifica��o para este leitor em uma dada inst�ncia do job. Os dados do ponto de verifica��o s�o definidos por este leitor e fornecidos atrav�s do m�todo checkpointInfo. Estes dados tamb�m fornecem ao leitor todas as informa��es necess�rias para retomar a leitura dos itens ap�s o rein�cio. Um valor nulo do ponto de verifica��o ser� transmitido na inicializa��o. Al�m disso, temos o m�todo readItem que retorna o pr�ximo item para ser processado. Para todas as strings lidas do List, uma nova inst�ncia de MeuregistroEntrada � criada e retornada do m�todo readItem. Retornando um null indica o fim do processamento. A anota��o @Named assegura que este bean pode ser referenciado em um Job XML.

O processador de item � uma implementa��o da interface ItemProcessor conforme mostra o exemplo da Listagem 5.

Listagem 5. Exemplo de um processador de item.


  @Named
  public class MeuProcessadorDeItem implements ItemProcessor {
                  @Override
                  public MeuRegistroSaida processItem(Object t) {
                                 MeuRegistroSaida o = new MeuRegistroSaida();
                                 //Mais c�digo aqui
                                 return o;
                  }
  }

Neste c�digo tornamos MeuProcessadorDeItem um processador de itens apenas implementando a interface ItemProcessor. O m�todo processItem aceita uma entrada do leitor de item e retorna uma sa�da que � passada ao escritor para agrega��o. Neste caso, o m�todo recebe um item do tipo MeuRegistroEntrada, aplicado a l�gica de neg�cio, e retorna um item de sa�da do tipo MeuRegistroSaida. O item de sa�da � ent�o agregado e escrito. Retornando null indica que o item n�o deveria continuar sendo processado. Este processador permite que itens de entrada indesejados sejam filtrados por processItem, por isso afirma-se que o processador de itens est� entre o step e o chunk. A anota��o @Named assegura que este bean pode ser referenciado em um Job XML.

O escritor de itens implementa a interface ItemWriter ou estende a classe AbstractItemWriter conforme mostra o exemplo da Listagem 6.

Listagem 6. Exemplo de um escritor de item.


  @Named
  public class MeuEscritorDeItem extends AbstractItemWriter {
                  @Override
                  public void writeItems(List list) {
                                 //Mais c�digo aqui
                  }
  }

Neste c�digo tornamos MeuEscritorDeItem um escritor de itens apenas estendendo a classe AbstractItemWriter. O m�todo writeItems recebe os itens agregados e implementa a l�gica de escrita para o escritor de item. Uma lista de MeuRegistroSaida � recebida. A anota��o @Named assegura que este bean pode ser referenciado em um Job XML.

Se o Job XML � definido em um arquivo meuJob.xml e empacotado no diret�rio META-INF/batch-jobs, ent�o podemos iniciar este job usando JobOperator conforme mostra o exemplo da Listagem 7.

Listagem 7. Exemplo utilizando JobOperator para iniciar o job.


  JobOperator jo = BatchRuntime.getJobOperator();
  long jid = jo.start("meuJob", new Properties());

Neste c�digo JobOperator fornece uma interface para opera��o de jobs. O m�todo start cria uma nova inst�ncia de um job e inicia a primeira execu��o desta inst�ncia. O Job XML deve estar dispon�vel no diret�rio META-INF/batch-jobs para arquivos ".jar" ou no diret�rio WEB-INF/classes/META-INF/batch-jobs para arquivos ".war". Arquivos Job XML seguem a conven��o de nomea��o �.xml�. O m�todo retorna o id de execu��o para a primeira inst�ncia.

J� que este job pode ser executado explicitamente ele pode ser executado atrav�s de um Servlet, EJB, entre outros. Segue na Listagem 8 um exemplo de um job sendo explicitamente executado num Servlet:

Listagem 8. Chamando um job atrav�s de um Servlet.


  protected void processRequest(HttpServletRequest request, HttpServletResponse response)
                  throws ServletException, IOException {
   
                  response.setContentType("text/html;charset=UTF-8");
                  try (PrintWriter out = response.getWriter()) {
                                 out.println("<html>");
                                 out.println("<head>");
                                 out.println("<title>Exemplo de Invoca��o de Job - Servlet</title>");
                                 out.println("</head>");
                                 out.println("<body>");
                                 out.println("<h1>Invocando Jobs no Servlet:</h1>");
   
                                 JobOperator jo = BatchRuntime.getJobOperator();
                                 long jid = jo.start("meuJob", new Properties());
   
                                 out.println("Job submetido: " + jid + "<br>");
                                 out.println("</body>");
                                 out.println("</html>");
                  } catch (JobStartException | JobSecurityException ex) {
                                 Logger.getLogger(TestServlet.class.getName()).log(Level.SEVERE, null, ex);
                  }
  }

Tamb�m podemos reiniciar o job usando o m�todo JobOperator.restart conforme mostra o exemplo da Listagem 9.

Listagem 9. Reiniciando um job.


  jo.restart(jid, props);

Neste c�digo, reiniciamos uma inst�ncia particular de um job. Um novo conjunto de propriedades pode ser especificado quando o job � reiniciado.

Podemos cancelar o job utilizando o m�todo JobOperator.abandon conforme mostra o exemplo da Listagem 10.

Listagem 10. Cancelando um job.


  jo.abandon(jid);

Neste c�digo, a execu��o do job � utilizada para cancelar uma inst�ncia particular de um job.

Podemos obter informa��es de um job que est� executando como mostra o exemplo da Listagem 11.

Listagem 11. Obtendo informa��es de um job em execu��o.


  JobExecution jexec = jo.getJobExecution(jid);
  Date createTime = jexec.getCreateTime();
  Date startTime = jexec.getStartTime();

Outra possibilidade � podermos especificar um conjunto diferente de propriedades durante m�ltiplas execu��es do mesmo job.

O n�mero de inst�ncias de um job com um nome particular pode ser encontrado conforme demonstra o exemplo da Listagem 12.

Listagem 12. Obtendo o n�mero de inst�ncia de um job com um nome especificado.


  int conta = jo.getJobInstanceCount("meuJob");

Neste c�digo, teremos como retorno o n�mero de inst�ncias de meuJob submetidos por esta aplica��o, executando ou n�o.

Todos os jobs com nomes conhecidos pelo batch em tempo de execu��o podem ser obtidos conforme mostra o exemplo da Listagem 13.

Listagem 13. Obtendo todos os jobs.


  Set<String> jobs = jo.getJobNames();

Este c�digo retorna o nome �nico do conjunto de jobs desta aplica��o.

Pontos de Verifica��o Customiz�veis

Pontos de verifica��o permitem marcarmos periodicamente o progresso atual de um step para que possamos habilitar o reinicio da execu��o a partir do �ltimo ponto de consist�ncia, seguindo uma interrup��o planejada ou n�o. Por padr�o, o final do processamento de cada "chunk" � um ponto natural para um ponto de verifica��o.

Podemos especificar uma pol�tica para um ponto de verifica��o customiz�vel usando o atributo checkpoint-policy em Job XML, conforme mostra a Listagem 14.

Listagem 14. Especificando uma pol�tica para um ponto de verifica��o customizado.


  <chunk item-count="3" checkpoint-policy="custom">
                  <reader ref="meuLeitorDeItem"/>
                  <processor ref="meuProcessadorDeItem"/>
                  <writer ref="meuEscritorDeItem"/>
                  <checkpoint-algorithm ref="meuAlgoritmoCheckpoint"/>
  </chunk>

Neste fragmento do Job XML o valor de checkpoint-policy � especificado como "custom", indicando que um algoritmo de ponto de verifica��o customiz�vel � utilizado. checkpoint-algorithm � um subelemento dentro do "chunk" em "step" cujo valor � um bean CDI que implementa a interface CheckpointAlgorithm ou estende a classe AbstractCheckpointAlgorithm. Segue na Listagem 15 um exemplo estendo a classe AbstractCheckpointAlgorithm.

Listagem 15. Implementando meuAlgoritmoCheckpoint especificado no Job XML.


  public class MeuAlgoritmoCheckpoint extends AbstractCheckpointAlgorithm {
                  @Override
                  public boolean isReadyToCheckpoint() throws Exception {
                                 if (MeuLeitorDeItem.COUNT % 5 == 0)
                                                 return true;
                                 else
                                                 return false;
                  }
  }

Neste c�digo, m�todo isReadyToCheckpoint � invocado em tempo de execu��o assim que cada item � lido. No corpo do m�todo isReadyToCheckpoint ser� determinado se � hora de verificar o chunk atual. O m�todo retorna true se o chunk precisa ser verificado ou false caso contr�rio.

Gerenciando Exce��es

Por padr�o quando qualquer batch lan�a uma exce��o, a execu��o do job finaliza com um status de "FAILED". Podemos sobrescrever o comportamento padr�o para o leitor, processador e escritor configurando exce��es para ignorar ou tentar a opera��o novamente. Segue na Listagem 16 um exemplo.

Listagem 16. Definindo exce��es para um job.


  <chunk item-count="3" skip-limit="3">
                  <reader .../>
                  <processor .../>
                  <writer .../>
   
                  <skippable-exception-classes>
                                 <include class="java.lang.Exception"/>
                                 <exclude class="java.io.IOException"/>
                  </skippable-exception-classes>
   
                  <retryable-exception-classes>
                                 <include class="java.lang.Exception"/>
                  </retryable-exception-classes>
  </chunk>

Neste fragmento de c�digo skip-limit especifica o n�mero de exce��es que este step ir� ignorar. skippable-exception-class especifica um conjunto de exce��es que o processamento de um chunk ir� ignorar. retryable-exception-class especifica um conjunto de exce��es que o processamento do chunk tentar� novamente realizar a opera��o. include especifica a classe de uma exce��o ou uma superclasse de exce��o para ignorar ou tentar novamente a opera��o. M�ltiplos elementos include podem ser especificados. exclude especifica a classe de uma exce��o ou uma superclasse de exce��o para n�o ignorar ou n�o tentar novamente a opera��o. M�ltiplos elementos exclude tamb�m podem ser especificados. Essas classes especificadas reduzem o n�mero de exce��es eleg�veis para serem ignoradas ou tentadas novamente.

Neste fragmento de c�digo acima temos que todas as exce��es ser�o ignoradas, exceto java.io.IOException.

As interfaces SkipReadListener, SkipProcessListener, e SkipWriteListener podem ser implementadas para receber o controle quando uma exce��o que foi marcada para ser ignorada � lan�ada.

As interfaces RetryReadListener, RetryProcessListener, e RetryWriteListener podem ser implementadas para receber o controle quando uma exce��o pass�vel de novas tentativas for lan�ada.

Processamento Batchlet

O estilo batchlet implementa um padr�o batch chamado roll-your-own. Este � um estilo de processamento orientado a tarefa onde uma tarefa � invocada uma vez, executa at� completar, e retorna um status de sa�da.

A interface Batchlet � usada para implementar um step. A classe abstrata AbstractBatchlet j� fornece implementa��es dos m�todos menos comumente implementados.

O Job XML � usado para definir um step com um batchlet conforme podemos verificar na Listagem 17.

Listagem 17. Definindo um step usando batchlet.


  <job id="meuJob" xmlns="http://xmlns.jcp.org/xml/ns/javaee" version="1.0">
                  <step id="meuStep" >
                                 <batchlet ref="meuBatchlet"/>
                  </step>
  </job>

Neste c�digo o elemento job identifica um job. Este elemento tem um nome l�gico "id" que � usado para identifica��o. Um job pode conter qualquer n�mero de etapas identificado por um elemento "step". Este tamb�m tem um "id" usado para identifica��o. O elemento batchlet define um step do tipo batchlet. Este � mutualmente exclusivo com o elemento chunk. O atributo "ref" � identificado como o nome de um bean CDI de uma classe que implementa a interface Batchlet ou estende AbstractBatchlet. Segue na Listagem 18 um exemplo.

Listagem 18. Definindo a classe especificada no atributo ref do batchlet.


  @Named
  public class MeuBatchlet extends AbstractBatchlet {
                  @Override
                  public String process() {
                                 //. . .
                                 return "COMPLETED";
                  }
  }

Neste c�digo MeuBatchlet � a implementa��o do batchlet definido anteriormente no Job XML. O m�todo process � chamado para executar o trabalho do batchlet. Podemos notar neste caso um status explicito de COMPLETE que � retornado como um status do job. Se este m�todo lan�ar uma exce��o, o batchlet termina com um status de FAILED. A anota��o @Named assegura que este bean pode ser referenciado em um Job XML.

Listeners

Os Listeners podem ser utilizados para interceptar uma execu��o de um batch. Listeners podem ser especificados em um job, step, chunk, leitor/escritor/processador para um chunk, skipping, e nas novas tentativas ap�s exce��es.

Segue na Tabela 1 uma lista de interfaces e classes abstratas que podem ser implementadas para interceptar a execu��o de um batch.

Interface	Classe Abstrata	Momento que Recebe o controle
JobListener	AbstractJobListener	Antes e ap�s a execu��o de um job, e tamb�m se uma exce��o � lan�ada durante o processamento de um job.
StepListener	AbstractStepListener	Antes e ap�s um step executar, e tamb�m se uma exce��o � lan�ada durante o processamento de um step.
ChunkListener	AbstractChunkListener	No in�cio e no fim do processamento de um chunk e antes e ap�s um ponto de verifica��o (checkpoint).
ItemReadListener	AbstractItemReadListener	Antes e ap�s um item ser lido por um leitor de item, e tamb�m se um leitor lan�a uma exce��o.
ItemProcessListener	AbstractItemProcessListener	Antes e ap�s um item ser processado por um processador de item, e tamb�m se o processador de item lan�ar uma exce��o.
ItemWriteListener	AbstractItemWriteListener	Antes e ap�s um item ser escrito por um escritor de item, e tamb�m se o escritor de item lan�ar uma exce��o.
SkipReadListener, SkipProcessListener, SkipWriteListener	Nenhum	Quando uma exce��o marcada como ignorada � lan�ada por um leitor, processador ou escritor de item.
RetryReadListener, RetryProcessListener, RetryWriteListener	Nenhum	Quando uma exce��o marcada como para permitir novas tentativas � lan�ada por um leitor, processador ou escritor de item.

Tabela 1. Interfaces e classes abstratas para interceptar a execu��o de um batch.

Os Listeners podem ser especificados no Job XML conforme a Listagem 19.

Listagem 19. Definindo Listeners no Job XML.


  <job id="meuJob" xmlns="http://xmlns.jcp.org/xml/ns/javaee" version="1.0">
                  <listeners>
                                 <listener ref="meuJobListener"/>
                  </listeners>
   
                  <step id="meuStep" >
                                 <listeners>
                                                 <listener ref="meuStepListener"/>
                                                 <listener ref="meuChunkListener"/>
                                                 <listener ref="meuItemReadListener"/>
                                                 <listener ref="myeutemProcessorListener"/>
                                                 <listener ref="meuItemWriteListener"/>
                                 </listeners>
   
                                 <chunk>
                                                 . . .
                                 </chunk>
                  </step>
  </job>

Os listeners s�o especificados como um filho de . Todos os outros listeners s�o especificados como um filho de . O valor do atributo ref � o nome do bean CDI de uma classe que implementa o listener correspondente.

Sequenciamento no Job

Um step � um elemento b�sico de execu��o que encapsula uma fase independente e sequencial de um job.

Um job pode conter qualquer n�mero de steps. Cada um desses steps pode ser um step do tipo chunk ou um step do tipo batchlet.

O pr�ximo step na sequ�ncia de execu��o do job precisa ser explicitamente especificado atrav�s do atributo "next" conforme podemos verificar na Listagem 20.

Listagem 20. Definindo a sequ�ncia de steps no Job XML.


  <job id="meuJob" xmlns="http://xmlns.jcp.org/xml/ns/javaee" version="1.0">
                  <step id="step1" next="step2">
                                 <chunk item-count="3">
                                                 <reader ref="meuLeitorDeItem"></reader>
                                                 <processor ref="meuProcessadorDeItem"></processor>
                                                 <writer ref="meuEscritorDeItem"></writer>
                                 </chunk>
                  </step>
   
                  <step id="step2" >
                                 <batchlet ref="meuBatchlet"/>
                  </step>
  </job>

Neste Job XML definimos um job usando dois steps com os nomes l�gicos "step1" e "step2". step1 � definido como um step do tipo chunk e step2 � definido como um step do tipo batchlet. step1 � executado primeiro e ent�o seguido por step2. A ordem dos steps � identificada pelo atributo next em step1. Dessa forma, step2 � o �ltimo passo no job. Al�m do step, a especifica��o descreve outros elementos de execu��o que definem a sequ�ncia de um job:

Flow: Define uma sequ�ncia de elementos que executam juntos como uma unidade;
Split: Define um conjunto de fluxos que executam concorrentemente;
Decision: Fornece uma maneira personalizada de determinar o sequenciamento entre steps (passos), flows (fluxos) e splits (divis�es).

O primeiro step, flow, ou split define o primeiro step, flow ou split a ser executado para um dado Job XML.

Nas pr�ximas se��es detalharemos mais cada um desses elementos.

Flow

Um elemento de execu��o flow define uma sequ�ncia de elementos que executam juntos como uma unidade. Quando o flow � finalizado, o fluxo inteiro transaciona para o pr�ximo elemento de execu��o. Segue na Listagem 21 um exemplo de como podemos especificar um flow.

Listagem 21. Definindo um flow e os pr�ximos elementos que ser�o executados no Job XML.


  <job id="meuJob" xmlns="http://xmlns.jcp.org/xml/ns/javaee" version="1.0">
                  <flow id="flow1" next="step3">
                                 <step id="step1" next="step2">
                                                 . . .
                                 </step>
   
                                 <step id="step2" >
                                                 . . .
                                 </step>
                  </flow>
                  
                  <step id="step3" >
                                 . . .
                  </step>
  </job>

Neste Job XML definimos um job usando um "flow" com o nome "flow1" e um step com o nome "step3". Tamb�m definimos "flow1" usando dois steps: "step1" e "step2". Dentro do "flow", "step1" � seguido por "step2". Um "flow" pode conter qualquer elemento de execu��o. O elemento de execu��o dentro de um flow pode transacionar apenas entre eles, eles n�o podem transacionar para elementos fora do fluxo. Por padr�o, "flow" � o �ltimo elemento de execu��o no job. Podemos especificar o pr�ximo elemento de execu��o usando o atributo "next". step3 � executado ap�s todos os passos em "flow1" serem finalizados. O valor do atributo "next" pode ser um nome l�gico (id) de um step, flow, split ou decision.

Split

Um elemento split define um conjunto de flows que executam concorrentemente. Segue na Listagem 22 um exemplo.

Listagem 22. Exemplificando o uso de split no Job XML.


  <job id="meuJob" xmlns="http://xmlns.jcp.org/xml/ns/javaee" version="1.0">
                  <split id="split1" next="step3">
                                 <flow id="flow1">
                                                 <step id="step1">
                                                                 . . .
                                                 </step>
                                 </flow>
   
                                 <flow id="flow2">
                                                 <step id="step2">
                                                                 . . .
                                                 </step>
                                 </flow>
   
                  </split>
                                                 
                  <step id="step3">
                                 . . .
                  </step>
  </job>

Neste Job XML definimos um job usando um "split" com o nome l�gico "split1" e um "step" com o nome l�gico "step3". Um "split" pode apenas conter elementos "flow". O "split" acima cont�m dois elementos "flow" com os nomes l�gicos "flow1" e "flow2". "flow1" tem um step chamado "step1" e "flow2" tem um "step" chamado "step2". Cada "flow" executa em uma thread separada. Por padr�o, "split" � o �ltimo elemento de execu��o no job. Podemos especificar o pr�ximo elemento de execu��o utilizando o atributo "next". O "split" � finalizado ap�s todos os "flows" completarem. Quando o "split" inteiro � finalizado, executa-se o pr�ximo elemento de execu��o. "step3" � executado ap�s todos "steps" em "split" serem finalizados. O valor do pr�ximo atributo pode ser um nome l�gico de um step, flow, split ou decision.

Decision

Um elemento decision fornece uma forma customizada de determinarmos o sequenciamento entre steps, flows e splits.

Quatro elementos de transi��o s�o definidos para sequenciar a execu��o de um job ou terminar a execu��o de um job. S�o eles:

next: Direciona a execu��o do flow para o pr�ximo elemento de execu��o.
fail: Causa a finaliza��o de um job com um status FAILED.
end: Causa o fim de um job com um status COMPLETED.
stop: Causa o fim do job com um status STOPPED.

O decision usa qualquer elemento de transi��o para selecionar a pr�xima transi��o. Segue na Listagem 23 um exemplo.

Listagem 23. Exemplificando um decision no Job XML.


  <job id="meuJob" xmlns="http://xmlns.jcp.org/xml/ns/javaee" version="1.0">
                  <step id="step1" next="decider1">
                                 . . .
                  </step>
   
                  <decision id="decider1" ref="meuDecider">
                                 <next on="DATA_LOADED" to="step2"/>
                                 <end on="NOT_LOADED"/>
                  </decision>
   
                  <step id="step2">
                                 . . .
                  </step>
  </job>

Neste Job XML definimos um job usando um step com o nome l�gico step1, um elemento decision com o nome l�gico decider1, e outro step com o nome l�gico step2. Um elemento decision � o destino do pr�ximo elemento de um step, flow, split, ou outro decision. Neste caso, decider1 � especificado como o valor do pr�ximo atributo de step1. O elemento decision segue para um step, flow, ou split.

O elemento decision tem uma refer�ncia para um batch Decider. Um Decider recebe o controle como parte de um elemento decision em um job e decide a pr�xima transi��o. O m�todo decide recebe um array de objetos StepExecution como entrada. Esses objetos representam o elemento de execu��o que fazem a transi��o para a execu��o deste decisor. O m�todo decide retorna um status de sa�da que atualiza a execu��o do job atual. Segue na Listagem 24 um exemplo de implementa��o de um Decider conforme referenciamos no Job XML anterior.

Listagem 24. Implementando a um Decider referenciado no Job XML.


  public class MeuDecider implements Decider {
                  @Override
                  public String decide(StepExecution[] ses) throws Exception {
                                 //. . .
   
                                 if (...)
                                                 return "NOT_LOADED";
   
                                 if (...)
                                                 return "DATA_LOADED";
                  }
  }

Este m�todo retorna NOT_LOADED ou DATA_LOADED no status de sa�da. O elemento decision usa o pr�ximo elemento de transi��o para transferir o controle para o step2 se o status de sa�da � DATA_LOADED. O job � finalizado atrav�s do elemento de transi��o �end� se o status de sa�da � NOT_LOADED.

Vale ressaltar que Fail, end, e stop s�o elementos de termina��o, pois eles causam a finaliza��o de um job.

Particionando o Job

Um step pode ser executado como um step particionado. Um step particionado executa como m�ltiplas inst�ncias do mesmo step atrav�s de m�ltiplas threads, sendo uma parti��o por thread. Cada parti��o pode ter par�metros �nicos que especificam em quais dados ele deve operar. Isso permite que um step seja particionado e executado em m�ltiplas threads, sem qualquer altera��o no c�digo Java existente.

O n�mero de parti��es e o n�mero de threads s�o controlados atrav�s de uma especifica��o est�tica no Job XML. Segue um exemplo na Listagem 25 de como podemos especific�-los.

Listagem 25. Especificando o n�mero de parti��es e threads no Job XML.


  <step id="meuStep" >
                  <chunk item-count="3">
                                 <reader ref="meuLeitorDeItem">
                                                 <properties>
                                                                 <property name="start" value="#{partitionPlan['start']}" />
                                                                 <property name="end" value="#{partitionPlan['end']}" />
                                                 </properties>
                                 </reader>
                                 <processor ref="meuProcessadorDeItem"></processor>
                                 <writer ref="meuEscritorDeItem"></writer>
                  </chunk>
   
                  <partition>
                                 <plan partitions="4" threads="2">
                                                 <properties partition="0">
                                                                 <property name="start" value="1"/>
                                                                 <property name="end" value="10"/>
                                                 </properties>
                                 
                                                 <properties partition="1">
                                                                 <property name="start" value="11"/>
                                                                 <property name="end" value="20"/>
                                                 </properties>
                                 </plan>
                  </partition>
  </step>

Neste c�digo, � um elemento opcional que � usado para especificar que um � um step particionado. O "partition plan" � especificado para um step do tipo chunk, mas pode ser especificado para um step do tipo batchlet tamb�m.

Cada tem um plan que especifica o n�mero de parti��es atrav�s do atributo partitions, o n�mero de parti��es para executarem concorrentemente atrav�s do atributo threads, e as propriedades para cada parti��o atrav�s do elemento . O atributo partition de cada uma das propriedades especifica a parti��o que a propriedade define.

Valores de propriedades s�o passadas para cada parti��o atrav�s do elemento property. Se essas propriedades precisam ser acessadas no leitor de item, ent�o eles s�o especificados com #{partitionPlan[' onde PROPERTY-NAME � o nome da propriedade.

Cada parti��o especifica duas propriedades, start e end, que depois s�o colocados � disposi��o do leitor de item como #{partitionPlan['start']} e #{partitionPlan['end']}.

Essas propriedades s�o ent�o acess�veis no leitor de item conforme exemplificado na Listagem 26.

Listagem 26. Acessando as propriedades atrav�s do leitor de item.

@Inject @BatchProperty(name = "start") private String startProp; @Inject @BatchProperty(name = "end") private String endProp;

Essas propriedades s�o ent�o dispon�veis no m�todo open do leitor de item. Cada thread executa uma c�pia separada do step.

O n�mero de parti��es e o n�mero de threads podem ser tamb�m especificados atrav�s de um batch chamado "partition mapper" conforme exemplificado na Listagem 27.

Listagem 27. Definindo parti��es e threads atrav�s de um batch partition mapper.

<partition> <mapper ref="meuMapper"/> </partition>

Neste c�digo o elemento fornece uma forma program�tica para calcular o n�mero de parti��es e threads para o step particionado. O atributo ref se refere ao nome do bean CDI da classe que implementa a interface PartitionMapper.

O elemento e o elemento s�o mutualmente exclusivos.

Podemos definir o batch mapper implementando a interface PartitionMapper conforme exemplificado na Listagem 28.

Listagem 28. Definindo programaticamente parti��es e threads.

public class MeuMapper implements PartitionMapper { @Override public PartitionPlan mapPartitions() throws Exception { return new PartitionPlanImpl() { @Override public int getPartitions() { return 2; } @Override public int getThreads() { return 2; } @Override public Properties[] getPartitionProperties() { Properties[] props = new Properties[getPartitions()]; for (int i=0; i<getPartitions(); i++) { props[i] = new Properties(); props[i].setProperty("start", String.valueOf(i*10+1)); props[i].setProperty("end", String.valueOf((i+1)*10)); } return props; } }; } }

Neste c�digo o m�todo mapPartitions retorna uma implementa��o da interface PartitionPlan. Este c�digo retorna PartitionPlanImpl, uma implementa��o b�sica da interface PartitionPlan.

O m�todo getPartitions retorna o n�mero de parti��es, o m�todo getThreads retorna o n�mero de threads usadas para executarem concorrentemente as parti��es. Por padr�o, o n�mero de threads � igual ao n�mero de parti��es. O m�todo getPartitionProperties retorna um array de Properties para cada parti��o.

As parti��es de um step particionado podem ter de compartilhar os resultados com um ponto de controle para decidir o resultado geral do step. Os batches PartitionCollector e PartitionAnalyzer s�o oferecidos para este tipo de necessidade.

Podemos concluir que aplica��es Batch na Plataforma Java EE 7 podem ser utilizadas para definir, implementar e executar jobs. Os jobs s�o compostos de tarefas que s�o executados sem a intera��o do usu�rio. Normalmente os jobs envolvem tarefas que s�o executadas periodicamente e requerem uma grande quantidade de processamento.

As aplica��es Batch s�o quebradas em um conjunto de steps que especificam sua ordem de execu��o, por�m tamb�m podem envolver funcionalidades mais complexas como elemento decision, execu��es paralelas de steps, entre outros.

Um step por sua vez pode conter um chunk ou batchlet que s�o diferentes formas de executar uma tarefa. Um chunk processa o dado lendo itens de uma fonte, processa esses itens e armazena os resultados. A vantagem do chunk se d� atrav�s de uma forma de armazenamento dos resultados mais eficiente e uma maior facilidade para a demarca��o da transa��o. No entanto, o batchlet executa a��es ao inv�s de processar itens de uma fonte. Enquanto que o chunk � utilizado para tarefas de longa dura��o e com grandes cargas de dados o batchlet pode ser usado para um conjunto de opera��es batch que s�o executados periodicamente.

A defini��o de um job est� no arquivo Job XML que especifica como o batch dever� ser executado.

Por fim, devemos salientar que existem algumas boas pr�ticas a serem seguidas no desenvolvimento de aplica��es Batch para Java na Plataforma Java EE 7.

Bibliografia

[1] The Java EE 7 Tutorial - Batch Processing. Dispon�vel em http://docs.oracle.com/javaee/7/tutorial/doc/batch-processing.htm

[2] Batch Applications tutorial on WildFly. Dispon�vel em http://www.mastertheboss.com/javaee/batch-api/batch-applications-tutorial-on-wildfly

[3] G. Arun, Java EE 7 Essentials. O�Reilly, 2013.