Elasticsearch: Realizando buscas no Big Data

Por que eu devo ler este artigo:

Esse artigo � �til para estudantes e profissionais que tenham alguma experi�ncia em Java e queiram dar os primeiros passos no desenvolvimento para Elasticsearch.

O artigo apresenta uma vis�o geral dos conceitos de minera��o de texto, um resumo das ideias b�sicas contidas no framework, os primeiros passos para o desenvolvimento neste segmento e a cria��o de buscas avan�adas.

Ao final, as ferramentas de filtros, agrega��es e sugest�es tamb�m ser�o apresentadas, a fim de melhorar o resultado das pesquisas.

Big Data � um termo que engloba uma larga quantidade de conceitos, t�cnicas e ferramentas, e cujo foco � gerenciar grandes quantidades de dados. Visto como um novo paradigma computacional, o Big Data promete capturar, armazenar, analisar e compartilhar dados da ordem de petabytes gerados por aplica��es nos mais distintos dom�nios.

Frequentemente associado ao Big Data, o objetivo do Elasticsearch � apoiar o desenvolvimento de aplica��es centradas em texto, como redes sociais, sistemas de e-commerce, sites de not�cias e canais de educa��o.

A grande vantagem do ES reside na sua arquitetura, projetada para ser escal�vel e para gerenciar grandes quantidades de dados de forma simples e eficiente.

A primeira vers�o foi lan�ada em 2010, pelo israelense Shay Banon. Desde ent�o, muitas vers�es foram liberadas e empresas do calibre da Wikipedia, GitHub, Foursquare e Globo.com passaram a utilizar o framework.

O c�digo do ES � desenvolvido em Java e est� baseado principalmente em dois frameworks da Funda��o Apache: o Lucene e o Hadoop.

O Lucene � utilizado como o motor de indexa��o e buscas em documentos desestruturados, e grande parte dos conceitos de programa��o deste � igualmente aplic�vel ao ES.

O Hadoop, por sua vez, � utilizado para escalar o sistema fazendo uso de jobs Map e Reduce, um modelo de programa��o paralela introduzido pelo Google. Como um dos seus diferenciais, o Elasticsearch possibilita que mesmo clientes n�o Java utilizem suas funcionalidades, via REST e JSON.

Com base nisso, este artigo tem como objetivo apresentar os conceitos b�sicos do ES e discutir sua API Java. Por motivos did�ticos, o ES ser� apresentado atrav�s de uma compara��o com um banco de dados relacional (ou BDR).

Sendo assim, ser�o analisados a partir de agora: os conceitos b�sicos e a arquitetura do ES; a instala��o, a inser��o e a busca de documentos utilizando comandos REST; e, finalmente, a API Java desta solu��o.

Conceitos b�sicos

O ES � uma ferramenta distribu�da para minera��o e tratamento de textos. Sua fun��o principal � permitir que documentos desestruturados fossem armazenados e recuperados de forma simples e eficiente. A arquitetura do ES, que foi projetada para sempre trabalhar em cluster, suporta grandes quantidades de dados.

Elasticsearch �, de forma geral, uma vers�o distribu�da do Lucene � framework para minera��o e tratamento de texto desenvolvido pela Funda��o Apache. Isto porque cada n� de um cluster ES cont�m tal framework para o gerenciamento das informa��es armazenadas.

Devido a essa rela��o, alguns dos conceitos b�sicos de ES s�o derivados do Lucene, a saber:

�ndice: define o endere�o para acesso �s informa��es guardadas no ES. De forma parecida com o esquema nos BDRs, necessitamos saber o nome e a localiza��o na rede de um �ndice (por exemplo, localhost:9200/nome_indice) para conectar-se e manipular as estruturas de armazenamento do ES;
Type: recurso usado para nomear conjuntos de documentos armazenados em um �ndice, podendo ser comparado ao conceito de tabela em BDRs, pois cont�m v�rios documentos que obedecem a uma mesma estrutura de campos;
Documento: � um texto plano � isto �, n�o corresponde a formatos bin�rios como .doc ou .pdf � organizado em campos delimitados por chaves e v�rgulas, de acordo com o padr�o JSON. Sua fun��o � similar ao das linhas de tabelas, j� que � sobre os documentos que as opera��es de manuseio de dados (inser��o, recupera��o, altera��o e exclus�o) s�o realizadas;
Campo (field): � a unidade m�nima de informa��o armazenada em um documento. Deve possuir um tipo, que pode ser padr�o � por exemplo: string, integer/long, float/double, boolean, ou null � ou criado pelo desenvolvedor. O campo tem a mesma fun��o de uma coluna no BDR;
Mapeamento (mapping): define a estrutura de um documento, contendo campos e a maneira como cada um deve ser armazenado e recuperado. O mapeamento funciona como a defini��o de colunas nas tabelas em BDRs;
Query DSL: � a linguagem de busca (para mais detalhes, veja a se��o Links). Est� para o Lucene como o SQL est� para os BDRs;
Score: valor num�rico que representa qu�o bem um documento est� relacionado a uma busca em Querydsql;
Analisador: mecanismo para transforma��o de texto � por exemplo: a convers�o de letras mai�sculas em min�sculas, o tratamento de espa�os em branco � durante o armazenamento e recupera��o de informa��es.

Para facilitar o entendimento, a Tabela 1 sumariza o relacionamento entre os conceitos do Lucene e os conceitos de BDRs apresentados nesta se��o.

Lucene	Banco de dados relacional (BDR)
�ndice (Index)	Esquema
Type	Tabela
Documento (JSON)	Linha
Campo (Field)	Coluna
Mapeamento (Mapping)	Estrutura da tabela
Query DSL	SQL

Tabela 1. Mapeamento entre conceitos de bancos de dados relacionais e ES

Outros conceitos, igualmente importantes, foram adicionados pelo ES para estender o Lucene e permitir sua execu��o em cluster. Dentre eles, os principais s�o:

N�: um servidor � virtual ou f�sico � que cont�m certo n�mero de shards e r�plicas;
Shard: um �ndice do Lucene que gerencia as informa��es armazenadas em um n�;
R�plica: tamb�m um �ndice Lucene, por�m gerenciado pelo ES como uma c�pia completa de algum dos outros shards do cluster. A r�plica cont�m os mesmos dados e � respons�vel pelas mesmas fun��es de um shard.

Ela pode ser utilizada em dois casos: para melhorar o desempenho das buscas e para garantir a disponibilidade do cluster. O primeiro caso permite que haja um balanceamento de carga entre os shards do ES, diminuindo o tempo de resposta, j� que o processamento das buscas ser� dividido entre os shards e suas r�plicas.

O segundo caso possibilita que o cluster continue funcionando mesmo ante uma falha do shard original. Assim, quando o shard do qual uma r�plica foi criada n�o estiver mais dispon�vel por causa de uma falha t�cnica ou um desastre, a r�plica dever� assumir as fun��es do shard original, garantindo que o ES continue operando normalmente;

Filter: oferece, em situa��es espec�ficas � por exemplo, verificar se uma informa��o existe no �ndice sem que seja necess�ria sua recupera��o completa do documento �, uma op��o de melhor desempenho em rela��o �s buscas com Query DSL;
Aggregation: mecanismo para sumarizar dados em estat�sticas relevantes, como a contagem, m�dia, diferen�a de tempo, entre outras.

A Figura 1 descreve a arquitetura do ES. Como pode ser observado, cada n� de um cluster ES cont�m um ou mais shards e r�plicas, gerenciados pelo Lucene.

E distribu�dos em diversos shards, podem estar diferentes �ndices contendo documentos descritos em JSON. O ES ainda permite que os n�s do cluster sejam configurados para armazenar ou n�o dados.

Os n�s que n�o armazenam dados s�o respons�veis apenas pelas atividades de processamento das buscas. Com o prop�sito de trabalharem de forma auto gerenciada, os n�s do cluster necessitam eleger um mestre (master), que ser� respons�vel por tarefas de administra��o, como a cria��o de um novo �ndice e adi��o de um novo n�.

Entretanto, o cliente n�o necessita saber o tipo do n� � ou seja, se cont�m dados, se � mestre, ou se apenas realiza busca � para enviar uma requisi��o HTTP/REST, j� que todos os servidores conhecem a topologia do cluster, a localiza��o dos documentos e podem redirecionar tais requisi��es para o servidor que cont�m as informa��es desejadas.

**Figura 1.** Arquitetura do Elasticsearch

Em resumo, o ES adiciona fun��es de cluster ao Lucene, a fim de manipular informa��o textual e atender as necessidades do Big Data.

Entender essas fun��es � muito importante para o desenvolvedor, por�m n�o � suficiente para a implementa��o de buscas de forma efetiva. Sendo assim, antes de continuar com exemplos pr�ticos, se faz necess�rio conhecer um pouco sobre an�lise de texto e entender como o ES avalia, armazena e recupera informa��es.

Para facilitar, a an�lise de texto ser� explicada atrav�s de exemplos usando dois conceitos centrais do Lucene/ES: as listas invertidas e os tokens.

Como ilustrado na Figura 2, se documentos contendo um campo com as frases �O Elasticsearch � desenvolvido em Java� e �Elasticsearch � uma ferramenta BigData� fossem inseridos em um �ndice ES, diferentemente de um BDR, antes de serem armazenados esses documentos seriam analisados e divididos em pequenos peda�os de informa��o chamados tokens.

Nesse exemplo, a partir da quebra das frases nos espa�os em branco, seriam gerados e armazenados em uma lista inversa os seguintes tokens: Elasticsearch, �, desenvolvido, em, Java, O, uma, ferramenta e BigData.

As listas inversas s�o utilizadas porque evitam a compara��o textual da busca com todos os campos de todos os documentos de um �ndice � uma atividade que pode ser muito lenta, j� que um �ndice pode conter muitos documentos.

Para ilustrar, se uma busca por documentos que contenham a palavra �Elasticsearch� fosse enviada ao �ndice da Figura 2, n�o seria necess�ria uma busca textual completa em cada um dos campos de texto dos dois documentos para verificar que ambos cont�m a palavra procurada, pois atrav�s de uma simples pesquisa diretamente na lista invertida � muito mais r�pida, j� que � internamente implementada como uma tabela hash�, os dois documentos seriam recuperados.

O processo de cria��o de tokens pode ser bastante complexo, incluindo an�lises de texto, remo��o de palavras indesejadas e cria��o de novos tokens derivados das palavras encontradas no documento original.

Tais transforma��es s�o realizadas por analisadores, como por exemplo, o analisador do tipo stemmer, que transforma as palavras em sua forma raiz. Na Figura 3 est�o ilustradas as transforma��es das palavras trabalhador, trabalho e trabalhar para a forma raiz: trabalh.

O ES oferece um grande conjunto de ferramentas para transforma��o de texto, por exemplo: transforma��o do texto para caracteres ascii, modifica��o de palavras para letras mai�sculas e remo��o de palavras muito longas, o que aumenta sua capacidade de busca, j� que em uma busca que contenha uma dessas palavras (no exemplo, trabalhador, trabalho e trabalhar), internamente ser� a forma raiz (�trabalh�, neste caso) que ser� utilizada nas compara��es.

Al�m disso, os analisadores podem ser combinados para obter tokens que sejam mais representativos para o dom�nio de neg�cio da aplica��o que est� sendo desenvolvida.

Por exemplo, em um site de e-commerce, as palavras usadas na busca de certo produto podem ser transformadas para sua forma raiz e em letras min�sculas, a fim de que mais resultados sejam retornados.

Para obter esse resultado, podemos combinar analisadores como whitespaces (que divide as palavras de acordo com os espa�os em branco entre elas), lowercase (que transforma todas as letras de uma palavra em min�scula), stopwords (que remove palavras que tenham pouca relev�ncia) e stemmer (que transforma a palavra na sua forma raiz), conforme ilustrado na Figura 4.

**Figura 4.** Exemplo de uso de analisadores

Em suma, internamente no ES, a seguinte sequ�ncia � executada:

Uma inser��o ou atualiza��o de documento � recebida via PUT ou POST;
Os analisadores s�o executados e cada documento � convertido em um ou mais tokens indexados;
Os tokens s�o armazenados em uma lista com ponteiros para a vers�o completa do documento.

Instala��o e comandos REST

Com os conceitos b�sicos j� abordados, podemos iniciar um exemplo pr�tico. Para tal, necessitamos do ES instalado em um servidor. Sendo assim, fa�a o download do arquivo contendo o framework diretamente no site (veja o endere�o na se��o Links), descompacte este arquivo no servidor, que deve possuir o JDK 1.6 instalado, e, na pasta bin, execute o comando bin/elasticsearch.

Caso tudo esteja funcionando bem, o Elasticsearch estar� dispon�vel no endere�o https://localhost:9200 e poderemos enviar comandos para o servidor. Como j� mencionado, a comunica��o com o ES � baseada na tecnologia REST, cujas vantagens s�o o suporte de qualquer linguagem que possa enviar requisi��es HTTP, a facilidade de integra��o e a escalabilidade. No contexto do ES, cada comando REST possui um equivalente em BDR, como ilustrado na Tabela 2.

Opera��o	Elasticsearch	BDR
Create (inserir)	POST ou PUT	INSERT
Retrieve (recuperar)	GET	SELECT
Update (atualizar)	PUT	UPDATE
Delete (excluir)	DELETE	DELETE

Tabela 2. Mapeamento entre comandos SQL e Elasticsearch

Dito isso, a partir de agora vamos ilustrar o seu uso atrav�s de um exemplo que simula a cria��o de uma biblioteca para artigos publicados na Java Magazine.

Para facilitar o desenvolvimento, os exemplos utilizar�o o Sense (vide se��o Links), um plugin para o Google Chrome que atua como um cliente enviando chamadas REST/HTTP.

O primeiro passo na utiliza��o do ES � a cria��o de um �ndice no servidor. Conforme ilustrado na Figura 5, o comando PUT /javamagazine/ ir� criar um �ndice chamado javamagazine.

Com o �ndice definido, o pr�ximo passo � a cria��o de um type com o mapeamento dos campos, como demonstrado na Listagem 1. Nesse c�digo, o type biblioteca � criado e nele, os campos autor, titulo, texto e assunto do artigo s�o definidos usando o tipo string.


  PUT /javamagazine/biblioteca/_mapping
  {
    "biblioteca" : {
      "properties" : {
        "autor" : {"type" : "string" },
        "titulo" : {"type" : "string" },
        "texto" : {"type" : "string" },
        "assunto" : {"type" : "string" }
      }
    }
  }

Listagem 1. Mapeamento dos campos

O mapeamento define tamb�m como cada campo ser� analisado durante seu armazenamento e recupera��o. Para isto, analisadores s�o definidos para cada campo ou o analisador padr�o � utilizado, como no caso da Listagem 1, onde n�o definimos nenhum analisador.

Da mesma forma que no t�pico anterior, o ES permite que analisadores sejam combinados para aumentar a capacidade de busca das aplica��es.

Para tal, devemos adicionar um novo analisador nas configura��es do �ndice, que est�o dispon�veis no endere�o /javamagazine/_settings. Esse endere�o n�o cont�m um arquivo, mas sim um documento JSON que especifica configura��es v�lidas para todo o �ndice, como � o caso de analisadores e filtros.

A Listagem 2 mostra como criar um analisador chamado analisador_titulo, que combina o analisador whitespaces, do tipo tokenizer, com os analisadores trim e lowercase, do tipo filter.

� importante notar que antes de realizar a altera��o das configura��es o �ndice deve ser fechado (com o comando POST /javamagazine/_close), ficando assim indispon�vel para buscas, e depois da altera��o deve ser reaberto (com o comando POST /javamagazine/_open), para que a altera��o da configura��o tenha efeito e para que os dados voltem a estar dispon�veis.


POST /javamagazine/_close
   
  PUT /javamagazine/_settings
  {
    "index": {
        "analyzer": {
          "analisador_texto": {
           "type": "custom",
           "tokenizer": "whitespace",
           "filter": ["trim", "lowercase"]}
          }
      }
    }     
  }
   
POST /javamagazine/_open

Listagem 2. Cria��o do analisador customizado

A fim de que o novo analisador seja utilizado, precisamos modificar o mapeamento de campos conforme a Listagem 3. Nesse exemplo, al�m do analisador_titulo, especificado na listagem anterior, s�o utilizados tamb�m os analisadores keyword e standard.

Os campos autor e assunto recebem o analisador keyword, que simplesmente transforma uma string em um token �nico e o campo texto recebe o analisador standard, que combina os analisadores lowercase e stopword.

Finalmente, o campo titulo recebe o analisador customizado analisador_titulo.


PUT /javamagazine/biblioteca/_mapping
  {
      "biblioteca" : {
          "properties" : {
              "autor" : {"type" : "string", "analyzer":"keyword" },
              "titulo" : {"type" : "string","analyzer":"analisador_titulo"},
              "texto" : {"type" : "string" ,"analyzer":"standard" },
              "assunto" : {"type" : "string" }
          }
      }
  }

Listagem 3. Uso de analisador customizado

Com o mapeamento definido, podemos utilizar o comando da Listagem 4 para inserir um novo artigo no �ndice criado para armazenar a biblioteca da Java Magazine. O valor �1� no comando POST /javamagazine/biblioteca/1 define o id do documento inserido.

Esse id pode conter qualquer valor alfanum�rico e caso omitido ser� gerado automaticamente pelo ES. Ap�s inserir o documento no �ndice, podemos recuper�-lo diretamente atrav�s do seu id.

Para tal, executamos o comando GET/javamagazine/biblioteca/1.


  POST /javamagazine/biblioteca/1
  { 
   "autor" : "Luiz",
   "titulo" : "Sua primeira aplica��o em Elasticsearch...",
   "texto" : "O objetivo do Elasticsearch � apoiar �",
   "assunto" : "Elasticsearch"
  }

Listagem 4. Comando para inser��o de documentos no ES

Como em bancos de dados relacionais, o ES tamb�m permite a atualiza��o e exclus�o de valores do �ndice. Na Listagem 5, o comando PUT atualiza o nome do autor para �Luiz Santana�.

Posteriormente, podemos utilizar o comando DELETE /javamagazine/biblioteca/1 para excluir esse registro.


  PUT /javamagazine/biblioteca/1
  { 
   "autor" : "Luiz Santana",
   "titulo" : "Sua primeira aplica��o em Elasticsearch...",
   "texto" : "O objetivo do Elasticsearch � apoiar �",
   "assunto" : "Elasticsearch"
  }

Listagem 5. Comando PUT para altera��o de documentos

Com o intuito de recuperar as informa��es manipuladas utilizando os conceitos apresentados at� aqui, devemos utilizar o comando GET javamagazine/biblioteca/_search?q=assunto:elasticsearch.

Este comando busca no type biblioteca do �ndice javamagazine documentos que contenham a palavra Elasticsearch no campo assunto. O termo _search deve sempre ser utilizado para enviar ao servidor as consultas que s�o definidas usando Query DSL no campo q.

Essa busca ir� retornar o documento JSON da Listagem 6, cujas propriedades mais importantes s�o:

took: descreve o tempo total gasto na execu��o da busca;
shards: conta quantos shards foram acessados para executar a busca;
hits: representa a lista dos resultados;
score: informa a relev�ncia do resultado de acordo com o algoritmo de similaridade utilizado.

Esses par�metros devem ser aproveitados pelo desenvolvedor para entender o comportamento do ES ap�s uma busca. Um exemplo � o score, que indica qu�o significativo foi a busca em rela��o aos documentos presentes no �ndice.

O algoritmo padr�o para o c�lculo desse par�metro � o TF/IDF, que se baseia simplesmente na semelhan�a entre os itens procurados na busca e os documentos do �ndice.

Modificando esse algoritmo podemos manipular o score de acordo com as necessidades do dom�nio de neg�cio para o qual a aplica��o est� sendo desenvolvida.

Por exemplo, na biblioteca para a Java Magazine que estamos desenvolvendo nesse artigo, podemos alterar o score para priorizar documentos que contenham mais p�ginas em lugar da simples similaridade textual.

Outra informa��o importante s�o os hits, que representam os documentos que possuem textos similares aos da busca enviada ao �ndice e est�o, por padr�o, ordenados do maior para o menor score.

Al�m disso, em rela��o ao array de hits, que o desenvolvedor dever� percorrer no momento de utilizar os dados retornados, podemos observar que cada hit indica o �ndice do qual foi recuperado (no caso do exemplo, javamagazine), seu tipo (no caso do exemplo, biblioteca), seu id, o score em rela��o a essa busca e, mais importante, o documento JSON contendo o resultado para os valores consultados.


  {
     "took": 2,
     "timed_out": false,
     "_shards": {
        "total": 5,
        "successful": 5,
        "failed": 0
     },
     "hits": {
        "total": 1,
        "max_score": 1.4054651,
        "hits": [
           {
              "_index": "javamagazine",
              "_type": "biblioteca",
              "_id": "1",
              "_score": 1.4054651,
              "_source": {
                 "autor": "Luiz Santana",
                 "titulo": "Sua primeira aplica��o em Elasticsearch...",
                 "texto": "O objetivo do Elasticsearch � apoiar �",
                 "assunto": "Elasticsearch"
              }
           }
        ]
     }
  }

Listagem 6. Resposta da busca no �ndice Java Magazine

Java API para Elasticsearch

A API Java para ES permite realizar os mesmos comandos expostos em REST. Para isto, � indicado utilizar o Maven como gerenciador de pacotes, j� que toda a documenta��o disponibilizada se baseia nesse padr�o.

O ES est� dispon�vel no Maven Central (vide se��o Links) e a Listagem 7 apresenta a depend�ncia Maven que deve ser adicionada ao pom.xml do seu projeto.



  <dependency>
      <groupId>org.elasticsearch</groupId>
      <artifactId>elasticsearch</artifactId>
      <version>1.3.2version>
  </dependency>

Listagem 7. Depend�ncia Maven para ES no pom.xml

Com o ambiente de desenvolvimento configurado, o primeiro passo na cria��o de uma aplica��o � estabelecer a conex�o com o cluster Elasticsearch, que pode estar em execu��o na pr�pria m�quina local ou remotamente.

Sendo assim, lembre-se que antes de executar a aplica��o o servidor deve ser iniciado, como explicado no t�pico anterior.

Existem duas formas de conectar-se ao cluster: criando sua aplica��o como um n�, usada quando necessitamos estender as capacidades do cluster ES; ou como um cliente puro.

Neste caso, o cliente acessar� o cluster remoto atrav�s de conex�es REST/HTTP, de forma parecida aos BDRs comuns. A classe Connection, exposta na Listagem 8, apresenta as duas formas de conex�o.

Em ambos os casos o ES deve estar dispon�vel para conex�o, isto �, necessitamos previamente instalar e configurar o cluster como apresentado na se��o anterior.

A primeira forma de conex�o � explicitada no m�todo createNode(), onde utilizamos o objeto nodeBuilder para criar um n� que far� parte de um cluster denominado clusterJavaMagazine.

Caso o nome do cluster seja omitido, o default, elasticsearch, ser� utilizado. Apesar dessa facilidade, � importante que o nome seja definido para que nosso n� n�o se conecte a um cluster qualquer que casualmente esteja acess�vel � o que poderia causar um problema conhecido como split brain.

Outro ponto importante � que o novo n� n�o tente armazenar informa��es � por isso definimos .client(true) no m�todo createNode() da Listagem 8 � e concentre seus esfor�os nas atividades relacionadas a buscas.

Apesar de estar dispon�vel, a op��o de criar um n� que armazene informa��es deve ser utilizada apenas em casos espec�ficos, nos quais as funcionalidades do ES necessitem ser estendidas, ou seja, quando queremos, por exemplo, controlar como os dados s�o armazenados no �ndice, como o cluster � gerenciado ou como requisi��es s�o respondidas.

A outra forma de estabelecer a conex�o com o ES � criar um cliente puro, como ilustrado no m�todo createClient(). Essa � a maneira mais simples de utilizar a API.

O cliente criado n�o ser� um n� do cluster, ele apenas acessar� as funcionalidades de um ES remoto. A partir de um socket que ser� conectado ao cluster denominado clusterJavaMagazine, configuramos o cliente atrav�s de um comando put settings encapsulado pela API no m�todo ImmutableSettings.settingsBuilder().put().

Para realizar essa conex�o (entre cliente e cluster), devemos definir o nome do cluster ao qual queremos conectar, seu endere�o de rede (no exemplo, localhost) e a porta de conex�o (no exemplo, usamos 9300, a padr�o do ES).

Em ambos os casos, o cliente desenvolvido ser� do tipo da interface Client (org.elasticsearch.client.Client) e realizar� todas as atividades de manipula��o de dados na aplica��o que estamos desenvolvendo, como veremos na sequ�ncia do artigo.



  package example.javamagazine;
   
  import org.elasticsearch.client.Client;
  import org.elasticsearch.client.transport.TransportClient;
  import org.elasticsearch.common.settings.ImmutableSettings;
  import org.elasticsearch.common.settings.Settings;
  import org.elasticsearch.common.transport.InetSocketTransportAddress;
  import org.elasticsearch.node.Node;
   
  import static org.elasticsearch.node.NodeBuilder.*;
   
  public class Connection {
   
   private Client;
   
  //conex�o como n� do cluster
   public Client createNode(){
    
    Node = nodeBuilder().clusterName("clusterJavaMagazine").
    client(true).node();
    client = node.client();
    
    return client;
   }
   
   //conex�o como cliente
   public Client createClient(){
    
    Settings =      ImmutableSettings.settingsBuilder().
      put("cluster.name","clusterJavaMagazine").build();
    TransportClient client = new TransportClient(settings);
   
    client.addTransportAddress(new
    InetSocketTransportAddress("localhost",9300));
    
    return client;
   }
   
  }

Listagem 8. C�digo para conex�o de uma aplica��o Java como cliente puro ou como n� do cluster

Com a conex�o estabelecida, podemos desenvolver m�todos para manipular as informa��es no ES. Na Listagem 9 s�o apresentados, atrav�s dos m�todos create(), retrieveAll(), update() e delete(), os seguintes comandos da interface org.elasticsearch.client.Client : prepareIndex(), para inser��o; prepareSearch(), para busca; prepareUpdate(), para atualiza��o; e prepareDelete(), para exclus�o.

Da mesma maneira que no t�pico anterior, devemos utilizar documentos JSON nos comandos de inser��o e altera��o. Por isso o ES oferece, atrav�s da sua API, a classe XContentBuilder, que facilita a cria��o de documentos JSON, evitando que o desenvolvedor tenha que escrever tais documentos a partir da concatena��o de strings.

Os documentos JSON criados com essa classe s�o inseridos ou atualizados respectivamente pelos m�todos prepareIndex() e prepareUpdate(), atrav�s da fun��o setSource() presente em ambos, ou seja, devemos criar o documento utilizando o XContentBuilder e inclu�-lo como par�metro do m�todo setSource().

Como ilustrado no m�todo retrieveAll() da Listagem 9, o m�todo prepareSearch() do objeto client � respons�vel por realizar uma consulta que retorna todos os documentos do �ndice. As informa��es s�o recuperadas como uma lista de SearchHit, sendo que cada elemento dessa lista representa um objeto contendo um documento JSON que pode ser acessado como um documento texto completo no m�todo hit.getSource() ou atrav�s dos seus campos pelo m�todo hit.getSource().get().

Este �ltimo m�todo receber� como par�metro o nome do campo que est� sendo consultado, por exemplo: hit.getSource().get("titulo").

Finalmente, para excluir um documento, devemos utilizar prepareDelete(), como ilustrado no m�todo delete() do nosso exemplo.

De forma bastante similar � se��o anterior � onde exclu�mos valores do �ndice atrav�s de REST/HTTP apenas usando o id �, o m�todo prepareDelete() exclui um documento de acordo com o id deste.


  package example.javamagazine;
   
  import static org.elasticsearch.common.xcontent.XContentFactory.jsonBuilder;
   
  import java.io.IOException;
   
  import org.elasticsearch.ElasticsearchException;
  import org.elasticsearch.action.search.SearchResponse;
  import org.elasticsearch.client.Client;
  import org.elasticsearch.common.xcontent.XContentBuilder;
  import org.elasticsearch.search.SearchHit;
   
  public class BibliotecaDAO {
   
   private Client client;
   private final static String index = "javamagazine";
   private final static String type = "biblioteca";
   
   public BibliotecaDAO(){
    Connection connection = new Connection();
    
    client = connection.createClient();
   }
   
  //m�todo para inclus�o de documento no �ndice
   public void create(String id, String autor, 
     String texto, String assunto) throws IOException {
   
    XContentBuilder builder = jsonBuilder()
         .startObject()
             .field("autor", autor)
             .field("titulo", texto)
             .field("texto", texto)
             .field("assunto",assunto)
         .endObject();
      
    client.prepareIndex(index, type, id)
      .setSource(builder).execute()
      .actionGet();
   }
   
  //m�todo para altera��o de documento no �ndice
   public void update(String id, String autor, 
     String texto, String assunto) throws ElasticsearchException, Exception {
   
    XContentBuilder builder = jsonBuilder()
         .startObject()
             .field("autor", autor)
             .field("titulo", texto)
             .field("texto", texto)
             .field("assunto",assunto)
         .endObject();
   
    client.prepareUpdate(index, type, id)
      .setSource(builder).execute()
      .actionGet();
   }
   
  //m�todo para recupera��o de todos os documentos do �ndice
   public void retrieveAll() {
    
    SearchResponse response = client.prepareSearch(index)
      .execute().actionGet();
   
    for (SearchHit hit : response.getHits().getHits()) {
     System.out.println("Id: " + hit.getId());                                    
     System.out.println("T�tulo: " + hit.getSource().get("titulo"));
    }
   }
   
  //m�todo para exclus�o de documento no �ndice
   public void delete(String id) {
    client.prepareDelete("javamagazine", "biblioteca", id);
   }
  }

Listagem 9. Exemplo de conex�o com o cluster e os m�todos de um CRUD

Da mesma maneira que nos BDRs, normalmente o �ndice e o mapeamento do ES s�o definidos diretamente no servidor, de forma pr�via ao desenvolvimento.

Entretanto, caso seja necess�rio, o ES oferece tamb�m uma API para administra��o e configura��o do cluster. Essa API que permite, por exemplo, criar, alterar e excluir �ndices e mapeamentos, tamb�m est� dispon�vel na interface org.elasticsearch.client.Client, por�m suas fun��es n�o s�o acess�veis atrav�s do objeto cliente (client) como nos exemplos anteriores, e sim atrav�s do m�todo client.admin().

A Listagem 10 apresenta o c�digo para cria��o program�tica do �ndice javamagazine e do seu mapeamento.

Para a cria��o do �ndice utilizamos o m�todo prepareCreate(), ao qual nesse exemplo inclu�mos, a t�tulo de ilustra��o, a defini��o da configura��o (setSettings()) para a altera��o do n�mero de shards para 1. Finalmente, usamos a classe XContentBuilder para criar um documento JSON definindo o tipo biblioteca e um mapeamento contendo os campos autor, titulo, texto e assunto, e posteriormente usamos o m�todo preparePutMapping() para adicionar o tipo e o mapeamento ao �ndice javamagazine.


  package example.javamagazine;
   
  import static org.elasticsearch.common.xcontent.XContentFactory.jsonBuilder;
   
  import java.io.IOException;
   
  import org.elasticsearch.ElasticsearchException;
  import org.elasticsearch.client.Client;
  import org.elasticsearch.common.settings.ImmutableSettings;
  import org.elasticsearch.common.xcontent.XContentBuilder;
   
  public class ClusterAdmin {
   
   private Client client;
   
   public void createIndex() throws ElasticsearchException, IOException {
   
    client.admin().indices()
      .prepareCreate("javamagazine")
      .setSettings(
        ImmutableSettings.settingsBuilder()
        .put("number_of_shards", 1))
      .execute().actionGet();
    
    XContentBuilder builder = jsonBuilder().startObject()
    .startObject("biblioteca")
    .startObject("properties")
     .field("autor", "string")
     .field("titulo", "string")
     .field("texto", "string")
     .field("assunto", "string")
    .endObject()
    .endObject()
    .endObject()             
    .endObject();            
    
    client.admin().indices()
      .preparePutMapping("javamagazine")
      .setType("biblioteca")
      .setSource(builder)
      .execute().actionGet();
   }
  }

Listagem 10. C�digo para cria��o de �ndice e mapeamento no ES

Agora que j� sabemos como criar e administrar um cluster, e realizar as fun��es b�sicas de manipula��o de informa��es em um �ndice, podem aprofundar nossos conhecimentos e melhorar os resultados das buscas.

Buscas usando a API Java para ES

Busca � a atividade central do ES! Todas as outras opera��es, como inser��o, atualiza��o, mapeamento e administra��o do cluster, visam tornar essa atividade mais r�pida e simples, e atender de forma eficiente as necessidades da aplica��o independente do seu dom�nio.

Por esse motivo, o ES oferece dezenas de op��es para recuperar documentos de um �ndice. No entanto, mesmo assim, as solu��es mais utilizadas s�o: term e match.

A busca do tipo term pode ser comparada �s consultas em bancos de dados relacionais, j� que ela procura coincid�ncias exatas entre os termos desejados e os valores do �ndice. A busca do tipo match, por outro lado, avalia as palavras da consulta enviada � utilizando os analisadores citados anteriormente � e retorna valores mesmo que a coincid�ncia n�o seja exata.

Por exemplo, se existe um documento no �ndice contendo o termo �Java� (com a primeira letra mai�scula) e for realizada uma busca por �java�, o match poder� encontrar o documento, mas o term n�o vai encontr�-lo por conta da diferen�a entre letras mai�sculas e min�sculas.

A Listagem 11 mostra o uso desses dois tipos de busca. O m�todo retrieveArtigosByAutor() procura artigos do �ndice usando term para retornar documentos que contenham no campo autor a palavra exata passada como par�metro de busca, enquanto retrieveArtigosByTitulo() procura os artigos do �ndice usando match para retornar documentos que contenham no campo t�tulo palavras que sejam similares �s palavras informadas para a busca.

O c�digo Java para consulta de ambos os tipos � term ou match � t�m a mesma estrutura: utilizando o objeto cliente, enviamos uma consulta ao �ndice atrav�s do m�todo setQuery().

Essas consultas s�o definidas pelos m�todos termQuery() e matchQuery() da classe QueryBuilders e, ao final da execu��o, retornar�o como resultado uma lista de SearchHit, cuja manipula��o foi omitida por ser igual � do exemplo da Listagem 9.

O m�todo retrieveArtigos() realiza uma busca do tipo match, por�m a estende aos campos titulo, texto e autor, ou seja, a mesma consulta vai considerar esses tr�s campos na sua execu��o e por isso ela � chamada de multi match, sendo definida com o m�todo QueryBuilders.multiMatchQuery().

Al�m disso, esse m�todo ilustra o uso do SCAN, que permite paginar os resultados da busca a fim de limitar a quantidade de informa��o retornada. Nesse exemplo, os valores ser�o retornados em grupos de 100 por shard (tamanho este que � definido no m�todo setSize()) at� que todos os resultados sejam recuperados, isto �, quando nenhum SearchHit seja retornado.

Novamente, o c�digo para manipula��o da lista de SearchHit foi omitido por j� ter sido apresentado.


   public void retrieveArtigosByAutor(String autor){
    SearchResponse response = client.prepareSearch(index)    
            .setTypes(type)
            .setSearchType(SearchType.DFS_QUERY_THEN_FETCH)
            .setQuery(QueryBuilders.termQuery("autor", autor))
            .execute()
            .actionGet();
    
    for (SearchHit hit : response.getHits().getHits()) {
      // Manusear resultados
    }
   }
   
   public void retrieveArtigosByTitulo(String titulo){
    SearchResponse response = client.prepareSearch(index)
            .setTypes(type)
            .setSearchType(SearchType.DFS_QUERY_THEN_FETCH)
            .setQuery(QueryBuilders.matchQuery("titulo", titulo))
            .execute()
            .actionGet();
   
    for (SearchHit hit : response.getHits().getHits()) {
      // Manusear resultados
    }
   }
   
   public void retrieveArtigos(String query) {
    SearchResponse response;
   
    while (true) {
     response = client
       .prepareSearch(index)
       .setTypes(type)
       .setSearchType(SearchType.SCAN)
       .setQuery(
        QueryBuilders.multiMatchQuery(query, 
          "titulo", "texto", "autor"))
       .setSize(100)
       .execute()
       .actionGet();
   
     for (SearchHit hit : response.getHits()) {
      // Manusear resultados
     }
     // Condi��o de parada do while anterior
     if (response.getHits().getHits().length == 0) {
      break;
     }
    }
   }

Listagem 11. Exemplos de c�digos de busca utilizando term e match

Adicionando filtros �s buscas com a API

Os filtros atuam de forma muito parecida com as buscas, mas devem ser utilizados para situa��es em que as respostas s�o do tipo sim ou n�o (por exemplo, no caso da consulta sobre a exist�ncia de um valor no �ndice) e na pesquisa por termos exatos.

A vantagem do seu uso � o desempenho, pois os filtros n�o calculam o score dos documentos e seus resultados podem ser armazenados em cache.

Na API Java para ES, um filtro � criado utilizando a classe FilterBuilder, como ilustrado na Listagem 12. Neste exemplo, a fun��o do filtro � limitar as respostas de uma pesquisa de acordo com um autor e um assunto espec�fico.

Tamb�m usamos dois termFilters que filtram documentos de acordo com um assunto e um autor. Al�m disso, esses termFilters s�o implementados atrav�s de um boolFilter, que os combina de acordo com as regras da l�gica booleana.

Em cada uma das regras definidas por boolFilter (must, should e mustNot) podem ser adicionados um ou mais filtros que ser�o analisados em conjunto. Tais regras s�o analisadas da seguinte forma: ser�o retornados os documentos que atendam aos filtros da regra must; n�o ser�o retornados os documentos que atendam aos filtros da regra mustNot; e os documentos que atendam aos filtros da regra should s� ser�o retornados caso nenhuma regra must seja atendida e atendam a uma quantidade m�nima de regras should (o valor m�nimo padr�o � 1).

Assim, o c�digo da Listagem 12 ir� retornar documentos que contenham exatamente o nome do autor, j� que o termFilter para autor est� na regra must, mas que n�o possuam o assunto passado para o m�todo como par�metro, j� que o termFilter para assunto est� na regra mustNot.


   public void retrieveUsingFilter(String autor, String assunto){           
    SearchResponse response = client.prepareSearch(index).setTypes(type)
      .setSearchType(SearchType.DFS_QUERY_THEN_FETCH)
      .setPostFilter(
        FilterBuilders.boolFilter()
           .must(FilterBuilders.termFilter("autor", autor))
           .mustNot(FilterBuilders.termFilter("assunto", assunto))                              
      )
      .execute()
      .actionGet();          
   
    for (SearchHit hit : response.getHits()) {
     // Manusear resultados
    }
   }

Listagem 12. C�digo para cria��o program�tica de um filtro

Adicionando agregadores �s buscas com a API

Agregar estat�sticas � parte essencial de uma ferramenta como o ES. Por exemplo, em um site de e-commerce, necessitamos saber quantos produtos existem no �ndice, o pre�o m�dio e o valor m�nimo desses produtos.

No ES, as Aggregations, ou agrega��es, permitem calcular esse tipo de informa��es anal�ticas para sumarizar os dados a partir de um conjunto de documentos. Representantes dessa categoria de c�lculo s�o: o valor m�ximo, o valor m�nimo, a m�dia e a soma.

O c�digo da Listagem 11, por exemplo, pode ser modificado para retornar o n�mero de artigos de acordo com o assunto, resultando no c�digo da Listagem 13. Como ilustrado nesse c�digo, o ES oferece a classe AggregationBuilders, com a qual podemos criar diferentes tipos de agregadores que s�o adicionados a uma busca pelo m�todo addAggregation().

Nesse caso, que contabiliza a quantidade de artigos que um autor possui em rela��o a determinado assunto, � criado um agregador do tipo contador (AggregationBuilders.count()) para o campo assunto.

Ap�s a execu��o dessa consulta, a resposta estar� no m�todo getAggregations(), que possui o resultado das agrega��es acess�veis por seu nome. No exemplo, usamos getAggregations().get("counter") para recuperar a quantidade, dividida por assuntos, de artigos presentes no �ndice.


  public void countArtigosBySubject(String autor) {
    SearchResponse response = client
      .prepareSearch(index)
      .setTypes(type)
      .setSearchType(SearchType.DFS_QUERY_THEN_FETCH)
      .setQuery(
       QueryBuilders.matchQuery("autor", autor))
       .addAggregation(                        
          AggregationBuilders
          .count("counter").field("assunto"))
       .execute().actionGet();
   
      System.out.println(response.getAggregations().get("counter"));
  }

Listagem 13. Aggregations aplicado ao �ndice de artigos

Adicionando sugest�es �s buscas com a API

Al�m de ser uma ferramenta simples e eficiente, o ES oferece alguns mecanismos interessantes para a cria��o de aplica��es mais amig�veis aos usu�rios.

Um desses mecanismos � conhecido como suggestions, ou sugest�es. As sugest�es funcionam quando um usu�rio deseja realizar uma busca, mas n�o sabe como escrever as palavras dessa busca.

Por exemplo, digamos que o usu�rio quer buscar um artigo que contenha no t�tulo a palavra �Java Magazine�. Usando as sugest�es, o usu�rio poder� digitar �J� que o ES se encarregar� de encontrar entre os documentos do �ndice poss�veis complementos para as letras digitadas.

Como ilustrado na Listagem 14, podemos modificar os c�digos anteriores a fim de permitir sugest�es durante a busca por t�tulos de artigos presentes no �ndice javamagazine.

Para tal, a fun��o addSuggestion() adiciona um objeto da classe TermSuggestionBuilder que ter� a fun��o de procurar no campo titulo dos documentos do �ndice as palavras passadas como par�metro para a fun��o do exemplo (retrieveWithSuggestions()). Podemos verificar na listagem que o construtor da classe TermSuggestionBuilder recebe como par�metro um nome para essa sugest�o � no exemplo, foi escolhido �sug�.

Os termos encontrados como sugest�o estar�o dispon�veis em getSuggest(), que possui distintas entradas (entry) representando cada um dos campos para os quais foi criada uma sugest�o � nesse exemplo possu�mos apenas a sugest�o �sug�.

Cada uma dessas entradas conter�, por sua vez, um conjunto de op��es, que est�o presentes em getOptions(). As op��es s�o levantadas de acordo com os documentos presentes no �ndice, isto �, o ES faz uma consulta ao �ndice para verificar como seria poss�vel completar a palavra baseando-se nos caracteres enviados pelo usu�rio.

No exemplo anterior, se o usu�rio procura por �Ja�, o ES poderia sugerir op��es como �Java�, �Java Magazine�, �Java SE� ou �JavaScript�.


   public void retrieveWithSuggestions(String query) {
    SearchResponse response = client
      .prepareSearch(index)
      .setQuery(QueryBuilders.matchAllQuery())
      .addSuggestion(
       new TermSuggestionBuilder("sug")
        .text(query).field("titulo")).execute()
      .actionGet();
    
    for (Entry<? extends Option> entry : response.getSuggest()
      .getSuggestion("sug").getEntries()) {
     
     System.out.println("Para o termo: " + entry.getText() + ". As op��es s�o:");
     for (Option option : entry.getOptions()) {
      System.out.println("\t" + option.getText());
     }
    }
   }

Listagem 14. Exemplo de uso do recurso de sugest�es com a API Java

Em apenas cinco anos o Elasticsearch deixou de ser uma solu��o desconhecida para conquistar grandes players do mercado de Big Data. A maturidade dessa tecnologia pode ser demonstrada pela recente cria��o de uma empresa, tamb�m chamada Elasticsearch, com o objetivo de guiar o desenvolvimento, divulgar, dar suporte e construir ferramentas � por exemplo, para gerenciamento do cluster, an�lise de logs de execu��o, integra��o com BDRs e clientes � que auxiliem a cria��o de aplica��es corporativas com alto n�vel de qualidade.

Em vista disso, espera-se que projetos de distintos dom�nios cada vez mais incluam o ES para gerenciar o armazenamento e a busca de suas informa��es textuais.

Do ponto de vista do desenvolvimento Java, � fundamental que, ap�s entender os conceitos apresentados neste artigo, o leitor avance seu conhecimento sobre os mecanismos internos do ES, j� que as possibilidades de combina��o de mapeamento, analisadores e tipos de busca s�o enormes.

Para tirar proveito das capacidades desta solu��o como um todo � importante tamb�m conhecer bem o dom�nio dos dados que ser�o inseridos no ES e ter em mente que durante o processo de desenvolvimento a aplica��o deve ser calibrada de acordo com suas peculiaridades.

Para manter-se atualizado, o leitor pode acompanhar, e eventualmente participar, do processo de desenvolvimento dos novos comandos e modifica��es no ES, que s�o previamente discutidos atrav�s da lista da comunidade de usu�rios (vide se��o Links).

Outra possibilidade muito interessante � acessar o c�digo do ES diretamente no GitHub, o que permite verificar detalhes da implementa��o que muitas vezes n�o est�o explicados na documenta��o oficial.

Finalmente, muitos outros artigos ainda podem ser escritos sobre ES. A seguinte lista oferece ao leitor uma ideia dos conceitos que ainda podem ser explorados: cria��o de plugins que estendam as funcionalidades do ES (por exemplo, para conex�o com BDRs, para an�lise de textos em portugu�s, para apresenta��o das informa��es armazenadas no �ndice); os mecanismos internos (como o processo de descoberta de servidores no cluster, o armazenamento de informa��es no shard e a recupera��o do shard ap�s uma falha); conceitos avan�ados de busca (por exemplo, ordena��o, boosting, scripts para altera��o do score); clientes para outras linguagens de programa��o (por exemplo, para PHP, Ruby, C#); tuning para melhoria de desempenho; monitoramento do cluster; e aplica��es baseadas em informa��es geogr�ficas.

Links:

GitHubdo autor, com os c�digos apresentados no artigo.
GitHub do projeto Elasticsearch.
Site da empresa Elasticsearch.
Plugin Sense.
ES no Maven Central.
Query DSL.

Confira tamb�m

Linguagem Java

Curso

Java: tipos de dados

Curso

O que � Java?

Curso

Confira outros conte�dos:

Por Luiz Em 2015

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Vanessa

Corre��o do problema encontrado ao executar o c�digo presente em "Listagem 2. Cria��o do analisador customizado."

deve ser utilizado o c�digo abaixo:

PUT /javamagazine/_settings
{
"settings": {
"analysis": {
"analyzer": {
"analisador_texto": {
"type": "custom",
"tokenizer": "whitespace",
"filter": [
"trim",
"lowercase"
]
}
}
}
}
}

há +1 ano

Daniella Gomes

DevMedia

Muito obrigada pela ajuda man!
Vamos deixar aqui de registro pra galera!
Forte abra�o[]

há +1 ano

Acelere seus resultados com o Prime.

Plano Start

12x R$89,00

Saiba mais

Plano Prime

12x R$199,00

Saiba mais

Plano Prime +

12x R$299,00

Saiba mais

Escolha seu Plano	Plano Start	Plano Prime	Plano Prime +
Forma��o completa Programador
Uso de IAs e automa��es
Exerc�cios gamificados
Projetos pr�ticos
Suporte ao conte�do
Comunidade de alunos
Cursos e artigos em +40 tecnologias
Trilha Monetize seu conhecimento
Mentoria T�cnica personalizada
Mentoria fazendo $ em 60 dias
Mentoria Primeiro emprego
Suporte humanizado 24 horas
Aulas exclusivas com especialistas
Mentorias mensais		2 por m�s	ilimitada
Tempo de assinatura	12 meses	12 meses	12 meses
	Saiba mais	Saiba mais	Saiba mais

Quero tirar uma d�vida

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Elasticsearch: realizando buscas no Big Data

Esse artigo mostra como preparar seus mecanismos de busca para lidar com Big Data usando Elasticsearch.

Conceitos b�sicos

Instala��o e comandos REST

Java API para Elasticsearch

Buscas usando a API Java para ES

Adicionando filtros �s buscas com a API

Adicionando agregadores �s buscas com a API

Adicionando sugest�es �s buscas com a API

Confira tamb�m

Linguagem Java

Java: tipos de dados

O que � Java?

Confira outros conte�dos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para come�ar a atuar como programador?

Por que a programa��o se tornou a profiss�o mais promissora da atualidade?

Quais s�o os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programa��o atrav�s da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem hor�rio para as aulas?

Por que a DevMedia n�o usa videoaulas em sua did�tica?

Preciso de um computador espec�fico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais s�o os planos de assinatura dispon�veis?

Adquirindo o plano, terei acesso a todo o conte�do?

A plataforma tem planos vital�cios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

Como excluir meus dados da plataforma?