Java EE 7: desenvolvendo processos batch

Por que eu devo ler este artigo:Neste artigo apresentamos a nova API da Java EE 7 para o desenvolvimento de processos em lote, a API de batch applications (JSR 352). Para isto, explicamos a problem�tica do desenvolvimento deste tipo de opera��o e mostramos como a API lida com boa parte das dificuldades deste contexto. Em seguida, demonstramos por meio de uma aplica��o exemplo como proceder para se programar um processo batch utilizando essa tecnologia.

Aplica��es corporativas muitas vezes s�o constru�das para lidar com processos que envolvem grandes volumes de dados. Neste cen�rio, � normal que apare�a a necessidade de desenvolvimento de processos em lote. Por causa disso, � importante para todos os desenvolvedores Java conhecer a API que se tornar� a padr�o para a cria��o de processos desse tipo.
Autores: Renan de Melo Oliveira, Julien Renaut e Marcelo Takeshi Fukushima

O desenvolvimento de software permitiu que diversas tarefas antes consideradas imposs�veis se tornassem n�o s� poss�veis, mas tamb�m vi�veis. Vivemos na era da informa��o onde o acesso a uma quantidade de dados virtualmente infinita est� ao alcance de um clique. Hoje podemos realizar transfer�ncias banc�rias entre diferentes bancos que s�o finalizadas em minutos, falar com voz e v�deo com um grupo de dezenas de pessoas distribu�das no mundo inteiro e realizar c�lculos com uma velocidade surpreendente. No entanto, computacionalmente falando, manipular tamanha quantidade de dados � um desafio.

No mercado de aplica��es corporativas � comum a necessidade de lidar com volumes massivos de dados. Processar manualmente estes dados � repetitivo e burocr�tico, gerando assim pouco valor para as empresas. No entanto, com os avan�os obtidos nos �ltimos anos, tanto em hardware como software, hoje � poss�vel automatizar muitos destes processos de forma a diminuir custos e aumentar a confiabilidade das informa��es extra�das.

Atualmente, uma das necessidades mais comuns em grandes opera��es de software � o desenvolvimento de processos batch (em lote). Processos batch s�o opera��es realizadas por um sistema que n�o necessitam de intera��o direta com o usu�rio. Estes processos s�o caracterizados por lidarem com um grande volume de dados e normalmente s�o executados em um per�odo diferente do hor�rio comercial � durante a madrugada por exemplo. Diversos fatores relacionados �s �reas de neg�cio destas empresas justificam essa necessidade, como a integra��o com outros sistemas, sumariza��o de opera��es financeiras realizadas durante o dia, ou mesmo limpezas peri�dicas.

A vers�o mais recente da Java Enterprise Edition (Java EE 7) incluiu a JSR 352 (Batch Applications for the Java Platform), uma biblioteca para desenvolvimento de processos em lote de forma f�cil e padronizada. Esta API permite definir, executar e acompanhar processos batch em um container compat�vel como o GlassFish 4.

Neste artigo, iremos implementar um processo batch para simular o fechamento de faturas de um sistema banc�rio, o FaturaWeb. O processo ser� composto por algumas etapas como convers�o de valores em d�lar e totaliza��o dos lan�amentos para uma fatura. Para isso, usaremos algumas das funcionalidades b�sicas da API, como a defini��o de uma tarefa e seus componentes, assim como o disparo e acompanhamento do processo como um todo.

Necessidades e problemas de processos em lote

Para compreendermos as vantagens desta API da forma como foi proposta, � importante avaliarmos os problemas inerentes de processos batch. Esta reflex�o � essencial para sabermos como lidar melhor com este tipo de opera��o.

Um processo em lote, como j� foi dito, � caracterizado por n�o necessitar de intera��o com o usu�rio, podendo ser executado de forma ass�ncrona. Uma opera��o ass�ncrona n�o exige que o componente chamador espere o t�rmino da execu��o para prosseguir com o restante das instru��es. Desta forma, uma opera��o ass�ncrona pode realizar um processamento demorado sem que isto impacte a experi�ncia do usu�rio, pois o mesmo n�o ficar� �travado� esperando a resposta da opera��o. Al�m disso, ao contr�rio do caso s�ncrono, a partir do momento em que o usu�rio requisita ou agenda a execu��o de um processo em lote, o mesmo perde o contato direto com a execu��o deste, dificultando o acompanhamento e a administra��o da tarefa.

No entanto, por serem ass�ncronos e normalmente demorados, � importante permitir que o usu�rio possa monitorar o andamento dos processos batch. Essa import�ncia tamb�m se aplica em casos em que ocorrem erros por conta de pr�-condi��es externas n�o satisfeitas, como a falta de dados oriundos de fontes externas, ou mesmo falhas de rede e quedas de energia. Para contornar tais problemas, a API permite que processos com erro possam ser reiniciados, seja do in�cio ou do ponto onde pararam.

Igualmente importante � saber se um processo batch foi conclu�do antes de se realizar alguma opera��o de neg�cio. Por exemplo, o c�lculo do valor da cota de um fundo de investimento � fundamental para determinar o valor dispon�vel para resgate de um cliente. Portanto, enquanto o processo batch respons�vel pelo c�lculo desta cota n�o terminar, o investidor n�o poder� realizar o resgate.

O controle transacional dos processos em lote tamb�m demanda um planejamento cuidadoso. H� casos em que a tarefa inteira deva ser executada em uma transa��o �nica e tamb�m casos em que commits parciais devam ser realizados durante a opera��o.

Al�m do que j� foi citado, tamb�m � desej�vel que os recursos computacionais do ambiente sejam corretamente utilizados, sejam eles diversos n�cleos de processamento ou diversas m�quinas em um cluster. Por�m, pode n�o ser trivial lidar com processamento paralelo no contexto de processos em lote, pois muitas vezes queremos que apenas parte de um processo seja executada em paralelo, enquanto outras partes precisam ser executadas de forma sequencial.

Em resumo, quando desenvolvemos processos batch nos deparamos com diversas necessidades e problemas. A seguir come�aremos o detalhamento da API de processos batch mostrando como os requisitos listados s�o supridos.

Funcionamento b�sico da API

A API de batches nos permite definir tarefas (jobs). Cada job representa a configura��o de um processo em lote e descreve de forma geral qual � o conjunto de etapas (steps) que devem ser realizadas durante a execu��o deste processo. Mais � frente iremos explicar mais detalhadamente como desenvolver uma aplica��o batch, por�m, de forma geral, esta API nos possibilita realizar as seguintes opera��es:

� Defini��o de tarefas (jobs), etapas (steps) e elementos de decis�o (decisions) em nossas aplica��es, sendo um processo batch representado por um job, que por sua vez consiste em um conjunto de steps inter-relacionados;

� Defini��o de um processo batch por meio de um fluxo completo de passos em um arquivo de configura��o;

� Informa��o de status para cada execu��o de processo;

� Execu��o de processos e a continua��o de processos interrompidos por meio de um controlador unificado;

� Tratamento de erros;

� Possibilidade de processamento paralelo de partes espec�ficas do processo ou da opera��o como um todo;

� Controle transacional integrado ao container (de forma autom�tica em muitos casos).

Nota: J� existem outras implementa��es de processos batch no mercado visando prover os itens supracitados, como Spring Batch e IBM WebSphere Compute Grid. No entanto, a JSR 352 � uma evolu��o e padroniza��o dessas bibliotecas e n�o por acaso as empresas citadas fazem parte do Expert Group desta JSR.

A cria��o desta API tem como objetivo facilitar a constru��o e parametriza��o de processos em lote atrav�s da defini��o de um fluxo de etapas (steps). Estas etapas s�o descritas em um arquivo XML por meio de uma linguagem chamada JSL (Job Specification Language) de modo que cada processo em lote deve ser descrito em um arquivo XML separado. As etapas que comp�em um processo podem ser implementadas de duas formas diferentes:

1. Processamento baseado em chunks: Esta op��o � a mais flex�vel para o uso da API, no entanto, � explicitamente separada em tr�s fases: 1) Leitura dos dados; 2) Processamento dos dados; e, 3) Escrita dos dados;

2. Processamento simples (Batchlet): Esta � uma op��o mais simples, que delega para apenas uma classe a execu��o de toda a etapa.

A exist�ncia desses dois tipos de etapas (chunks e batchlets) permite que o desenvolvedor escolha a implementa��o mais adequada de acordo com a a��o a ser executada. As caracter�sticas de cada etapa, como seu tipo, s�o indicadas no momento da defini��o da tarefa (job), realizada via JSL e melhor detalhada posteriormente no artigo.

As etapas baseadas em chunks s�o as que se beneficiam de mais recursos da API, por�m s�o um pouco mais trabalhosas de serem implementadas. Uma das funcionalidades dispon�veis para chunks � o particionamento da etapa para que seja executada em tarefas paralelas. Desta forma utilizamos melhor os diversos n�cleos de processamento de um servidor, aproveitando melhor os recursos dispon�veis e possivelmente acelerando a execu��o da etapa.

Ao particionarmos uma etapa do tipo chunk em tarefas paralelas a API tamb�m permite que estas tarefas sejam paradas, reiniciadas ou mesmo descartadas. Isto � poss�vel porque a API possui uma estrutura de checkpoint que armazena o estado da execu��o das tarefas, guardando o estado da etapa para que esta possa ser reiniciada posteriormente, caso necess�rio.

Por todos estes conceitos estarem abstra�dos pela API de processos batch, desenvolver aplica��es que se beneficiem deste modelo de programa��o tornou-se mais f�cil. Al�m disto, por estarmos em um container Java EE 7, ganhamos automaticamente a integra��o com outros recursos desta especifica��o, como acesso f�cil ao banco de dados via JPA (Java Persistence API), inje��o de depend�ncias com CDI (Contexts and Dependendy Injection), agendadores de tarefas (Scheduler), etc.

Preparando o ambiente

Preparar um ambiente de desenvolvimento para se criar uma aplica��o Java EE 7 � uma tarefa simples. Basta fazermos o download do JDK 7 e do GlassFish 4 vers�o full, servidor de aplica��o de refer�ncia da especifica��o Java EE.

Al�m disto, para facilitar o desenvolvimento, iremos utilizar o Eclipse para a escrita de nosso c�digo, o Maven como ferramenta de constru��o e controle de depend�ncias do projeto, e o M2E, plugin do Eclipse que facilita a integra��o do Eclipse com o Maven.

Dentre as tecnologias empregadas para o nosso exemplo, iremos descrever apenas a instala��o do GlassFish 4, visto que os outros j� s�o amplamente adotados em grande parte dos projetos Java. Para mais detalhes sobre a instala��o do Maven e do M2E, veja a se��o Links.

Fim do trecho gratuito • continue abaixo

CONTE�DO EXCLUSIVO

Desbloqueie toda a DevMedia

+2000 artigos e v�deos

+40 trilhas sobre Front-end, Back-end, IA e muito mais

+5000 exerc�cios pr�ticos

Mentorias ao vivo individuais

at� 50% OFF

A partir de

R$ 69 /m�s
Assinar agora

// 25 ANOS FORMANDO PROGRAMADORES

APRENDA A

PROGRAMAR DE VERDADE

Um caminho claro do zero ao avan�ado, com pr�tica de verdade.

Voc� constr�i projetos reais desde o come�o e sai sabendo programar sozinho, sem copiar c�digo de professor.

Forma��es completas

+40 Projetos

+5000 exerc�cios

+40 Tecnologias

Mentorias individuais

Suporte com IA

Comunidade de alunos

QUERO COME�AR AGORA

Confira outros conte�dos:

Introdu��o ao JDBC

Novidades do Java

Teste unit�rio com JUnit

Por Devmedia Em 2014

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Ebix Consulting

Boa tarde.

N�o consegui retornar o Properties de forma alguma.

Tentei usando:
JobOperator jobOperator = BatchRuntime.getJobOperator();
Properties propriedadesParticao = jobOperator.getParameters(context.getExecutionId());

e tamb�m:
Properties properties = contextoBatch.getProperties();

Em todas as formas retorna null.

Gostaria de adicionar um objeto no mapper e pegar ele no Reader.

há +1 ano

Ver coment�rios anteriores (19)

Marcio Souza

Com certeza vai ser.

Obrigado de novo =D

há +1 ano

Compartilhe esse conte�do com um amigo!
Fa�a login para ganhar recompensas.
Copie o link e envie para seus amigos
Ou