Aten��o: esse artigo tem uma palestra complementar. Clique e assista!

De que se trata o artigo:

Examinamos t�cnicas de programa��o geralmente classificadas no dom�nio de ETL ou Data Warehousing, que permitem manipular volumes muito grandes de dados.

Para que serve:

Persist�ncia e distribui��o de informa��es s�o requisitos comuns na maioria das aplica��es, mas as mesmas t�cnicas que nos permitem tratar cem mil registros por dia talvez n�o sirvam para cem milh�es de registros por dia. Veremos alguns truques, especialmente de persist�ncia, para encarar esse trabalho pesado de forma robusta e eficiente.

Em que situa��o o tema � �til:

O principal assunto tratado no artigo � a persist�ncia de dados em grande volume; portanto, ser� de interesse para programadores que lidam com bases de dados de m�dio a grande porte (tabelas com milh�es de registros ou mais). Falaremos de JDBC, MySQL (especificamente o recurso de particionamento do MySQL 5.1), e apresentaremos dicas gerais para ler, gravar e transmitir grandes fluxos de dados.

Neste artigo, vamos abordar a manipula��o de dados em grande volume. Este problema n�o � intr�nseco � plataforma Java; � um desafio enfrentado por desenvolvedores que trabalham com sistemas de back-end de todos os tipos, mas o Java � e especialmente o Java EE � � hoje uma das principais plataformas utilizadas para construir tais sistemas.

Os problemas que vamos discutir exigem, em geral, um tratamento hol�stico, n�o podendo ser solucionados apenas por alguns passes de m�gica de programa��o � uma API especial aqui, um algoritmo avan�ado ali. Pode ser tamb�m necess�rio otimizar seu c�digo SQL ou schemas f�sicos de SGBD; repensar sua arquitetura de comunica��o; ajustar estrat�gias de integra��o com outros sistemas, e assim por diante. Assim, vamos falar um pouco de Java, mas tamb�m um pouco de outras tecnologias e tamb�m de arquitetura em geral. Mas para deixar a discuss�o toda mais concreta, trabalharemos com um exemplo pr�tico de aplica��o.

O sistema de Cota��es

Nossa aplica��o de exemplo trabalha com cota��es de a��es (stock quotes). Este � um dos exemplos mais �manjados� da �rea de mensageria / distribui��o de dados. Primeiro, os volumes de dados s�o enormes, frequentemente na ordem de milhares de mensagens por segundo. Para piorar, estes dados frequentemente t�m uma log�stica complexa de distribui��o e processamento, e a a��o toda deve acontecer em tempo real.

No pior-caso, em aplica��es de HFT (high-frequency trading), bancos de investimento usam supercomputadores com softwares que analisam cota��es com modelos matem�ticos sofisticados, tentando detectar tend�ncias de curt�ssimo prazo, e tomam decis�es de compra ou venda milissegundos ap�s uma informa��o decisiva ser disponibilizada. A necessidade de tanta velocidade � a competi��o � h� v�rios bancos usando a mesma t�cnica, e n�o basta tomar a decis�o correta, � preciso ser o primeiro a faz�-lo para ficar com o lucro.

Como se parece uma cota��o de a��es? Um registro completo � que pode ser obtido de um web service p�blico como o popular Yahoo! Finance � inclui informa��es como as da Tabela 1, entre muita outras que n�o vamos incluir aqui para n�o �inchar� o exemplo.

Campo	Valor
S�mbolo da a��o	PZE
Valor atual	16.25
Data/Hora da �ltima altera��o	15/03/15/2010 04:02
Altera��o (fechamento � abertura)	-0.19
Valor de abertura	16.44
Valor m�ximo no dia	16.54
Valor m�nimo no dia	16.25
Volume negociado	20590

Tabela 1. Exemplo de registro de cota��es (para a Petrobras Energia / NYSE).

Schema de dados

Vamos criar uma tabela relacional, bastante simples, a partir dos nossos campos de cota��o. Eu vou usar o MySQL 5.1, mas somente com c�digo SQL ANSI, de forma que a aplica��o funcionar� em outros SGBDs.

Listagem 1. Tabela para as cota��es.


  CREATE TABLE QUOTE
  (
    symbol     CHAR(5) NOT NULL,
    updateTime DATETIME NOT NULL,
    value      DECIMAL(10,2) NOT NULL,
    valOpen    DECIMAL(10,2),
    valMin     DECIMAL(10,2),
    valMax     DECIMAL(10,2),
    volume     DECIMAL(10)
  );
   
  ALTER TABLE QUOTE ADD CONSTRAINT PK_QUOTE PRIMARY KEY(symbol, updateTime);

A Listagem 1 mostra a DDL da tabela. J� podemos identificar algumas decis�es importantes:

� N�o temos nenhuma redund�ncia. Uma coluna para a altera��o n�o � necess�ria, pois basta subtrair o valor de abertura do valor de fechamento. Tamb�m n�o precisamos de uma coluna para o valor de fechamento, pois este valor � nulo em hor�rios de preg�o aberto, e quando n�o � nulo (preg�o fechado) � igual ao valor atual;

� N�o temos normaliza��o. Especialmente numa vers�o mais completa da tabela, um design relacional purista (3NF) determinaria o uso de mais de uma tabela. Esque�a isso. Nossa tabela ir� acumular centenas ou milhares de registros por segundo � dezenas de milh�es por dia � e queremos dispensar os custos de joins, FKs, etc. Mesmo a chave prim�ria (PK) s� foi criada por que esta chave acompanha o �ndice por symbol + updateTime, importante para consultas � tabela.

Gravando dados

A primeira dica aqui � �bvia: esque�a qualquer ferramenta de persist�ncia de alto n�vel � JPA, iBatis ou qualquer outra coisa. Voc� precisar� trabalhar somente com JDBC e SQL.

O segundo truque tamb�m n�o � nenhuma novidade: vamos inserir registros em batches, usando as facilidades de PreparedStatement. Por�m, o problema n�o para por a�. Nossa aplica��o estar� recebendo estes dados continuamente, 24h por dia (imagine que somos alimentados por dados de bolsas de toda parte do mundo: sempre tem algum preg�o aberto).

Isso quer dizer que n�o podemos simplesmente abrir uma conex�o, criar um statement preparado de INSERT, fazer um loop gravando uma cole��o de registros, fazer commit e terminar. A �cole��o de registros� � algo que nunca termina, e n�o existem transa��es do ponto de vista negocial. H� apenas um fluxo cont�nuo de dados que devem ser carregados na tabela.

Listagem 2. POJO para a cota��o.


  import java.text.SimpleDateFormat;
  import java.util.Date;
   
  public class Quote {
    private final String symbol;
    private final Date updateTime;
    private final float value;
    private final float valOpen;
    private final float valMin;
    private final float valMax;
    private final int volume;
    
    public Quote (final String symbol, final Date updateTime,
      final float value, final float valOpen, final float valMin,
      final float valMax, final int volume) {
      this.symbol = symbol;
      this.updateTime = updateTime;
      this.value = value;
      this.valOpen = valOpen;
      this.valMin = valMin;
      this.valMax = valMax;
      this.volume = volume;
    }
   
    public final String getSymbol () {
      return symbol;
    }
    public final Date getUpdateTime () {
      return updateTime;
    }
    public final float getValue () {
      return value;
    }
    public final float getValOpen () {
      return valOpen;
    }
    public final float getValMin () {
      return valMin;
    }
    public final float getValMax () {
      return valMax;
    }
    public final int getVolume () {
      return volume;
    }
    
    @Override
    public String toString () {
      return symbol +
        "@" + new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(updateTime) +
        " = " + value;
    }
  } ...

Quer ler esse conteúdo completo? Tenha acesso completo

Tecnologias:

Confira outros conte�dos:

Introdu��o ao JDBC

Novidades do Java

Teste unit�rio com JUnit

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Osvaldo Em 2010

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso