As Principais Ferramentas do NoSQL no Java

Por que eu devo ler este artigo:Uso de novas ferramentas e conceitos relacionados ao armazenamento de dados. Neste artigo s�o exploradas algumas das principais ferramentas NoSQL, apresentando como instalar e utilizar cada uma delas atrav�s da linguagem Java.

NoSQL � um movimento que promove solu��es de armazenamento de dados n�o relacionais. Ele � composto por diversas ferramentas que, de forma particular e espec�fica, resolvem problemas como tratamento de grandes volumes de dados, execu��o de consultas com baixa lat�ncia e modelos flex�veis de armazenamento de dados, como documentos XML ou JSON.

As tecnologias NoSQL n�o t�m como objetivo substituir os bancos de dados relacionais, mas apenas propor algumas solu��es que em determinados cen�rios s�o mais adequadas. Desta forma � poss�vel trabalhar com tecnologias NoSQL e banco de dados relacionais dentro de uma mesma aplica��o.

As ferramentas apresentadas neste artigo s�o importantes em cen�rios onde sistemas de banco de dados tradicionais n�o s�o suficientes ou adequados �s necessidades espec�ficas, tais como: baixa lat�ncia, grandes volumes de dados, escalabilidade ou estruturas em que as conex�es entre os dados s�o t�o importantes quanto o pr�prio dado. Todas as tecnologias abordadas apresentam situa��es de uso particulares, que podem ser �teis na substitui��o dos tradicionais bancos de dados relacionais.

O que � NoSQL?

Cada tecnologia NoSQL apresentada neste artigo tem suas pr�prias caracter�sticas. O Redis adota o modelo chave-valor, utiliza a mem�ria para aloca��o de dados e � ideal para utiliza��o de Cache. O MongoDB implementa o modelo baseado em documentos, tem foco no tratamento de grandes volumes de dados e � ideal para grande parte das aplica��es web. J� o Neo4j, uma das ferramentas NoSQL mais maduras, tem o modelo baseado em grafos e seus principais casos de uso est�o relacionados a motores de recomenda��o, an�lise de rotas geogr�ficas e redes sociais. Por fim, tem-se o Cassandra, que � uma implementa��o open source do modelo de dados do BigTable com a arquitetura distribu�da do Dynamo.

Na primeira parte desta s�rie, foi apresentado o conte�do te�rico, abordando temas como hist�ria, arquiteturas e modelos de dados alternativos ao relacional, permitindo compreender que esta nova buzzword est� mais relacionada a uma nova escola de pensamento, do que a uma tecnologia em particular.

Esta segunda parte ter� um foco pr�tico, tendo como objetivo principal instalar e utilizar, atrav�s da linguagem Java, algumas das principais ferramentas NoSQL. Todas elas s�o projetos open source, o que nos permite experiment�-las sem ter um custo inicial de aquisi��o.

As ferramentas apresentadas neste artigo ser�o: Redis (chave-valor), MongoDB (documento), Neo4J (grafo) e Cassandra (fam�lia de colunas). Elas foram especialmente selecionadas de forma a representar os principais modelos de dados e diferentes arquiteturas apresentadas no primeiro artigo.

Redis

O Redis foi criado no in�cio de 2009 pelo italiano Salvatore Sanfilippo com o objetivo de melhorar a performance de seu produto de an�lise em tempo real de p�ginas web. Em mar�o de 2010 Salvatore foi contratado pela VMWare para se dedicar exclusivamente ao desenvolvimento do Redis, que hoje conta tamb�m com a dedica��o do holand�s Pieter Noordhuis, al�m de contribui��es vindas da forte comunidade formada em torno desta ferramenta.

Sem d�vida esta � uma das ferramentas NoSQL mais utilizadas atualmente. Escrito em ANSI C, tem seu modelo baseado em chave-valor e utiliza a mem�ria RAM como principal meio de aloca��o de dados, por�m oferece um mecanismo paralelo de serializa��o em disco, bem como um mecanismo opcional de log (AOF � Append Only File). Atualmente seu modelo de distribui��o de dados � baseado em master/slave, no entanto est� em desenvolvimento o recurso de cluster.

Para instalar o Redis fa�a o download dos fontes (oficialmente ele � distribu�do apenas neste formato) da vers�o mais recente e est�vel, descompacte o arquivo e execute o comando make na pasta descompactada (portanto � necess�rio ter em seu ambiente o make e um compilador C).

O Redis n�o � suportado e n�o deve ser usado em produ��o em ambientes Windows. Entretanto, caso voc� utilize Windows, poder� usar o Cygwin ou fazer o download de uma vers�o j� compilada para Windows.

Colocar o servidor do Redis no ar � uma tarefa bem simples, basta executar no terminal (ou no prompt) o comando ./redis-server (ou redis-server.exe no Windows). Feito isso, o servidor do Redis ir� gerar algumas mensagens no pr�prio console, como exibido na Listagem 1. Caso tenha alguma dificuldade, verifique as permiss�es de execu��o do seu usu�rio.

Listagem 1. Exemplo de sa�da gerada no console pelo redis-server.

[22925] 01 Oct 18:38:44 # Warning: no config file specified, using the default config. In order to specify a config file use 'redis-server /path/to/redis.conf'
  [22925] 01 Oct 18:38:44 * Server started, Redis version 2.0.2
  [22925] 01 Oct 18:38:44 * The server is now ready to accept connections on port 6379
  [22925] 01 Oct 18:38:44 - 0 clients connected (0 slaves), 1074272 bytes in use

Para acessar o Redis atrav�s do Java, utilizaremos a biblioteca Jedis, que implementa o protocolo do Redis em Java. A Listagem 2 mostra o c�digo necess�rio para adicionar e recuperar um par de chave-valor.

Listagem 2. C�digo Java utilizando o Jedis para comunica��o com o Redis.

import redis.clients.jedis.Jedis;
   
  public class TesteRedis {
    public static void main(String[] args) {
      // Estabelece conex�o com o Redis
      Jedis jedis = new Jedis("localhost", 6379);
      // Adiciona o par chave-valor
      jedis.set("cadastro:porcelli:nome", "Alexandre Porcelli");
      // Busca o valor a partir da chave
      String valor = jedis.get("cadastro:porcelli:nome");
      System.out.println("Valor recuperado: " + valor);
      jedis.quit();
    }
  }

Neste c�digo a classe Jedis � instanciada com os par�metros de endere�o e n�mero da porta do servidor (�localhost� e 6379, respectivamente). Para armazenar um par de chave-valor utilizamos o m�todo set() passando como par�metros a chave e o valor. � importante ressaltar que ambos devem ser obrigatoriamente do tipo String. J� para recuperar o valor armazenado, utilizamos o m�todo get() passando a chave desejada como par�metro. Por fim, fechamos a conex�o com o servidor atrav�s do m�todo quit().

A nota��o utilizada para representar a chave na Listagem 2 (utilizando o caractere �:� como separador) n�o � obrigat�ria, por�m � uma boa pr�tica que pode ser empregada em qualquer key-value store. Esta nota��o adota o seguinte padr�o: o primeiro elemento identifica o que est� sendo armazenado (no caso da Listagem 2, dados de um cadastro), o segundo elemento � o identificador �nico (que neste exemplo � o nome do usu�rio porcelli) e o terceiro, que � opcional, representa um campo da estrutura armazenada (neste caso o nome).

Este padr�o pode parecer estranho inicialmente, principalmente quando os dados s�o decompostos em campos. Esta decomposi��o acaba naturalmente gerando um n�mero maior de chaves. Mas tenha em mente que em um modelo de chave-valor voc� s� pode obter um dado atrav�s de sua chave. Neste exemplo, para obter o nome cadastrado para o usu�rio porcelli basta utilizar a chave cadastro:porcelli:nome. A Figura 1 mostra dois exemplos de como utilizar este formato.

Exemplos de constru��o de
chave — **Figura 1**. Exemplos de constru��o de chave.

Para compilar e rodar o c�digo da Listagem 2, execute os seguintes comandos com o servidor do Redis no ar:


  $ javac TesteRedis.java -cp jedis.jar
  (unix) $ java -cp jedis.jar:. TesteRedis
  (windows) C:\ java -cp jedis.jar;. TesteRedis

O Redis suporta valores com at� 1 Gigabyte de tamanho que s�o armazenados no formato string binary-safe (ou seja, uma cadeia de bytes formatada como String). Devido a este formato podemos armazenar e recuperar dados bin�rios como imagens, v�deos ou simplesmente textos.

No exemplo exibido na Listagem 2, utilizamos a estrutura mais simples, por�m o Redis disponibiliza outras estruturas de dados mais ricas como Listas, Sets, Sets Ordenados e Hashes, o que torna esta ferramenta bastante �til em diversos cen�rios.

A utiliza��o mais comum do Redis � como Cache, substituindo ferramentas como o Memcached, com a vantagem de serializar dados em paralelo no disco (o que permite, em caso de crash, subir o cache j� �esquentado�, ou seja, com dados). Outras utiliza��es comuns s�o a implementa��o de gerenciadores de filas (utilizando o recurso de Listas) e servidores de chat ou broadcast em geral (utilizando o recurso de publish/subscribe).

Para saber mais sobre o Redis, visite: redis.io. L� voc� encontrar� links para uma �tima documenta��o, bem como alguns exemplos de uso.

MongoDB

O MongoDB, que teve seu primeiro release p�blico em novembro de 2009, foi criado por Dwight Merriman (um dos fundadores da DoubleClick) e Eliot Horowitz (ex-funcion�rio da DoubleClick), que juntos formaram a 10gen, empresa respons�vel pelo desenvolvimento e suporte profissional do MongoDB.

Esta � uma ferramenta NoSQL bastante popular, inclusive tem sido considerada o novo M (�anteriormente� ocupado pelo MySQL) da stack LAMP (Linux, Apache, MongoDB e PHP, Perl ou Python). Conta com diversos cases importantes entre start-ups web, como bit.ly (que utiliza o MongoDB para armazenar o hist�rico de URLs encurtadas de seus usu�rios) e foursquare (onde o MongoDB � utilizado como ferramenta principal de armazenamento de dados), bem como em empresas mais tradicionais, como � o caso do The New York Times, que passou a utiliz�-lo para armazenar dados de uma aplica��o para submiss�o de imagens.

Sua estrutura de dados � baseada em documento, e tem como principal caracter�stica a capacidade de trabalhar com grandes volumes de dados. Inclusive o nome MongoDB vem da express�o �huMONGOus�, que pode ser traduzida como muito grande ou enorme. Ele � escrito em C++ e disponibilizado, j� compilado, para os principais sistemas operacionais. Uma particularidade dessa ferramenta � a capacidade de executar consultas ad-hoc � poucas ferramentas NoSQL oferecem este recurso.

� importante ressaltar que, para usar o MongoDB em produ��o � necess�rio um ambiente 64 bits (ele funciona em 32 bits, mas com limite de 2GB para armazenamento de dados), bem como execut�-lo em mais de uma m�quina em cluster (utilizando master/slave ou atrav�s de replica-set), pois a durabilidade dos dados no MongoDB � �garantida� apenas atrav�s da distribui��o dos dados. � previsto para a vers�o 1.8, ainda sem data definida, a durabilidade de dados baseado em uma �nica m�quina.

Para instalar o MongoDB basta fazer o download da vers�o mais recente e est�vel (veja se��o Links) e descompactar o arquivo. Antes de iniciar o MongoDB � necess�rio criar a pasta onde ser�o armazenados os dados. Em ambientes Linux/Mac/Unix, o local padr�o � /data/db (no Windows, C:\data\db).

Colocar o servidor do MongoDB no ar � uma tarefa bastante simples. Basta executar no terminal (ou no prompt) o comando ./mongod (ou mongod.exe no Windows). Dessa forma o servidor ir� gerar algumas mensagens no pr�prio console, conforme a Listagem 3. Caso tenha algum problema na execu��o do mongod, verifique as permiss�es de execu��o do seu usu�rio.

Listagem 3. Exemplo de sa�da gerada no console pelo MongoDB.

Tue Oct  5 11:16:06 MongoDB starting : pid=24582 port=27017 dbpath=/data/db/ 64-bit 
  Tue Oct  5 11:16:06 db version v1.6.3, pdfile version 4.5
  Tue Oct  5 11:16:06 git version: 278bd2ac2f2efbee556f32c13c1b6803224d1c01
  Tue Oct  5 11:16:06 sys info: Darwin erh2.10gen.cc 9.6.0 Darwin Kernel Version 9.6.0: Mon Nov 24 17:37:00 PST 2008; root:xnu-1228.9.59~1/RELEASE_I386 i386 BOOST_LIB_VERSION=1_40
  Tue Oct  5 11:16:06 [initandlisten] waiting for connections on port 27017
  Tue Oct  5 11:16:06 [websvr] web admin interface listening on port 28017

No MongoDB os documentos s�o armazenados em cole��es, que por sua vez s�o agrupadas em databases. Para melhor entender esta estrutura podemos compar�-la com a de um banco de dados relacional, onde:

Documentos correspondem �s linhas;
Cole��es correspondem �s tabelas;
Databases tem fun��o id�ntica ao database de um banco de dados relacional.

Para acess�-lo atrav�s do Java, assim como no Redis, precisamos de uma biblioteca que implemente seu protocolo. No caso do MongoDB, existe um driver suportado pelo pr�prio time de desenvolvimento (veja a refer�ncia em Links). A Listagem 4 mostra um programa Java que adiciona o documento exibido na Listagem 5, e faz uma busca pelo mesmo atrav�s de um de seus campos.

Listagem 4. C�digo Java para armazenar e procurar um documento no MongoDB.

import java.net.UnknownHostException;
  import com.mongodb.BasicDBObject;
  import com.mongodb.DB;
  import com.mongodb.DBCollection;
  import com.mongodb.DBObject;
  import com.mongodb.Mongo;
  import com.mongodb.MongoException;
   
  public class TesteMongo {
   
    public static void main(String args[]) throws UnknownHostException,
     MongoException {
      
      // Abre a conex�o com o servidor do MongoDB
      Mongo mongo = new Mongo("localhost", 27017);
   
      // Seleciona um database, caso o database n�o exista ele ser� criado
      DB db = mongo.getDB("MeuDatabase");
      // Seleciona uma cole��o para armazenar os dados, caso a cole��o n�o
      // exista ela ser� criada
      DBCollection coll = db.getCollection("pessoas");
   
      // Criando o documento
      BasicDBObject dados = new BasicDBObject();
      dados.put("id", 1);
      dados.put("nome", "Alexandre Porcelli");
      dados.put("email", " alexandre.porcelli@gmail.com ");
   
      // Criando o sub-documento
      BasicDBObject endereco = new BasicDBObject();
   
      endereco.put("rua", "r. qualquer");
      endereco.put("numero", 1022);
   
      // Anexando o sub-documento ao documento
      dados.put("endereco", endereco);
   
      // Insere o documento no servidor
      coll.insert(dados);
   
      // Para executar uma pesquisa com crit�rios (cl�usula where em sql) no
      // MongoDB, basta criar um documento modelo que
      // contenha os campos e os valores que devem ser pesquisados.
      // Portanto aqui � criado a estrutura para encontrar documentos onde o
      // campo id tenha o valor igual a 1
      BasicDBObject cond = new BasicDBObject();
      cond.put("id", 1);
   
      // Executa uma pesquisa que retorna apenas o primeiro documento que
      // atenda a condi��o da busca
      DBObject documentoEncontrado = coll.findOne(cond);
   
      System.out.println(documentoEncontrado);
   
      // Fecha a conex�o com o servidor
      mongo.close();
    }
  }

Listagem 5. Documento que ser� armazenado no MongoDB.

{
    id : 1,
    nome : "Alexandre Porcelli",
    email : "alexandre.porcelli@gmail.com", 
    endereco : { 
      rua : "r. qualquer" , 
      numero : 1022
    }
  }

Neste c�digo a classe Mongo � instanciada com os par�metros de endere�o e n�mero da porta do servidor (�localhost� e 27017, respectivamente) para estabelecer a conex�o com o MongoDB. O pr�ximo passo � obter um database, utilizando o m�todo getDB() passando como par�metro o nome do database desejado. Caso n�o exista, o MongoDB ir� cri�-lo automaticamente na primeira opera��o de inclus�o de dados em uma cole��o deste banco.

Agora precisamos obter uma cole��o, pois � nela onde o documento ser� efetivamente armazenado. Para obt�-la, basta chamar o m�todo getCollection() da classe DB com o nome da cole��o desejada como par�metro. Caso a cole��o n�o exista, o MongoDB, assim como no caso do database, ir� cria-la automaticamente na primeira opera��o de inclus�o.

Para a cria��o dos documentos, o MongoDB disponibiliza a classe BasicDBObject, que de fato � uma implementa��o da interface Map<String, Object>, onde cada chave adicionada no map (utilizando o m�todo put()) se tornar� um campo do documento. Nos casos de campos complexos (ou seja, campos compostos por sub-campos), como � o caso do endere�o da Listagem 5, basta criar um novo documento com os dados necess�rios (linhas 23 a 26 da Listagem 4) e adicion�-lo como um valor normal do campo complexo (linha 35). Agora com o documento criado (linhas 23 at� 35), basta inseri-lo na cole��o atrav�s do m�todo insert() da classe DBCollection.

Ap�s inserir o documento, vamos realizar uma consulta para encontr�-lo. O MongoDB permite a execu��o de consultas ad-hoc que podem conter restri��es (algo parecido com a cl�usula where da linguagem SQL). Estas restri��es, ou condi��es, podem contemplar um ou mais campos. Neste c�digo de exemplo utilizamos a seguinte condi��o para encontrar nosso documento: campo id dever� ser igual a 1. Esta restri��o deve ser passada como par�metro para o m�todo de consulta atrav�s de um documento JSON (linhas 45 e 46 da Listagem 4).

O m�todo que iremos utilizar para executar esta consulta � o findOne() da classe DBCollection, com o par�metro definido anteriormente. Este m�todo retorna apenas o primeiro documento encontrado. Para consultas onde � necess�rio buscar mais de um documento, utilize o m�todo find(). Ele retornar� um Iterator com os documentos encontrados. Por fim fechamos a conex�o com o servidor atrav�s do m�todo close() da classe Mongo.

Para compilar e rodar o c�digo da Listagem 4 execute os seguintes comandos com o servidor do MongoDB no ar:


  $ javac TesteMongo.java -cp mongo.jar
  (unix) $ java -cp mongo.jar:. TesteMongo
  (windows) C:\ java -cp mongo.jar;. TesteMongo

Uma caracter�stica da API do MongoDB � a utiliza��o extensiva de JSON. Ele foi projetado para utilizar extensivamente, tanto no lado servidor como no cliente, a linguagem JavaScript. E na linguagem JavaScript o formato JSON � nativo. Por�m, infelizmente, criar documentos JSON em Java para comunica��o com o MongoDB � um pouco burocr�tico devido a quantidade de c�digo necess�rio, se compararmos com linguagens como Ruby ou o pr�prio JavaScript.

No entanto, repare que n�o foi preciso fazer nenhuma configura��o pr�via para executar este c�digo, pois ao executar o m�todo insert() ele se encarrega de criar o database e a cole��o, caso qualquer um n�o exista.

Devido a natureza flex�vel orientada a documentos de sua estrutura de dados, s�o in�meros os casos de uso para o MongoDB. Existem diversas aplica��es web que est�o utilizando esta ferramenta de forma a substituir totalmente o uso de bancos de dados relacionais. Um destaque vai para o armazenamento de informa��es geoespaciais, que conta com um tipo de �ndice especial para este tipo de dado. Outra aplica��o comum � a utiliza��o do MongoDB para armazenar logs que ser�o posteriormente analisados.

O MongoDB � uma ferramenta repleta de recursos. Alguns dos destaques s�o a capacidade de cria��o de �ndices e a possibilidade de executar consultas em modo explain, o que permite entender melhor como uma consulta est� sendo executada, e de que forma � poss�vel melhorar sua execu��o tirando maior proveito dos �ndices criados.

Neo4j

O Neo4j foi idealizado em 2000 pela equipe de uma software house sueca chamada Windh Technologies. Em 2002 j� contava com a maior parte dos recursos dispon�veis atualmente, e por volta de 2003 teve seus primeiros cases de aplica��es importantes rodando em produ��o. Atualmente o Neo4j � desenvolvido e suportado profissionalmente pela Neo Technology (uma spin-off da Windh Technologies).

Esta � uma das ferramentas NoSQL mais maduras. Seu modelo � baseado em grafos, sendo, inclusive, um dos poucos NoSQL que implementam as propriedades ACID. Ele � escrito em Java, o que permite utiliz�-lo atrav�s de um servidor dedicado ou embarcado dentro de uma aplica��o. Para iniciar com o Neo4j basta fazer o download da vers�o mais recente e est�vel do kernel e descompactar o arquivo.

A Listagem 6 mostra um programa Java que utiliza o Neo4J de forma embarcada, e cria uma pequena rede social entre alguns personagens do filme Matrix.

Listagem 6. C�digo Java utilizando o Neo4j.

import org.neo4j.graphdb.GraphDatabaseService;
  import org.neo4j.graphdb.Node;
  import org.neo4j.graphdb.Relationship;
  import org.neo4j.graphdb.RelationshipType;
  import org.neo4j.graphdb.Transaction;
  import org.neo4j.kernel.EmbeddedGraphDatabase;
   
  public class TesteNeo4j {
    
    // Enum que define os tipos de relacionamento entre os n�s
    public enum MeusTiposDeRelacionamento implements RelationshipType { CONHECE }
   
    public static void main(String[] args) {
      // Abre (em caso de n�o existir, cria) uma conex�o com o banco de dados de grafo
      GraphDatabaseService graphDb = new EmbeddedGraphDatabase("db/matrix-social");
      // Inicia a transa��o
      Transaction tx = graphDb.beginTx();
      try {
        // Cria��o de n�s
        Node thomasAnderson = graphDb.createNode();
        Node trinity = graphDb.createNode();
        Node morpheus = graphDb.createNode();
        // Cria��o de relacionamentos entre os n�s (personagens)
        Relationship link1 = thomasAnderson.createRelationshipTo(trinity,
          MeusTiposDeRelacionamento.CONHECE);
        Relationship link2 = trinity.createRelationshipTo(morpheus,
          MeusTiposDeRelacionamento.CONHECE);
        // Adiciona algumas propriedades nos n�s e nos relacionamentos
        thomasAnderson.setProperty("nome", "Thomas Anderson");
        trinity.setProperty("nome", "Trinity");
        morpheus.setProperty("nome", "Morpheus");
        morpheus.setProperty("cargo", "Capit�o");
        link1.setProperty("mensagem", "texto 1!");
        link2.setProperty("mensagem", "texto 2!");
   
        // Commit da transa��o
        tx.success();
                      
        System.out.println(thomasAnderson.getProperty("nome"));
        System.out.println(trinity.getProperty("nome"));
        System.out.println(morpheus.getProperty("nome"));
   
      } finally {
        // Finaliza��o da transa��o
        tx.finish();
        // Shutdown no banco
        graphDb.shutdown();
      }
    }
  }

Neste c�digo criamos uma base de dados de grafo atrav�s da classe EmbeddedGraphDatabase, que � instanciada recebendo como par�metro o caminho para o diret�rio onde os dados ser�o armazenados. No caso deste exemplo estamos utilizando o Neo4j de forma embarcada, ou seja, o servidor do Neo4j estar� rodando dentro da aplica��o. Deste modo, quando a aplica��o for encerrada o Neo4j tamb�m ser� encerrado.

Para executar qualquer opera��o que modifique o estado do grafo � necess�rio iniciar uma transa��o atrav�s do m�todo beginTx() da interface GraphDatabaseService. Com o objetivo de assegurar que esta transa��o seja finalizada de forma adequada, todas as opera��es devem ser executadas em um bloco try/finally.

Criar n�s no Neo4j � bem simples, basta executar o m�todo createNode() da interface GraphDatabaseService, que retornar� uma nova inst�ncia da interface Node. Para criar relacionamentos entre n�s, primeiramente � necess�rio definir os tipos de relacionamento da aplica��o atrav�s da cria��o de um enum, que obrigatoriamente deve implementar a interface RelationshipType do Neo4j. No caso da Listagem 6, o enum MeusTiposDeRelacionamento define um �nico tipo de relacionamento que ser� utilizado no exemplo (neste caso CONHECER).

O relacionamento entre os n�s � criado atrav�s do m�todo createRelationshipTo() da interface Node, que deve ser executado no n� de origem, passando como par�metro o n� de destino, bem como o tipo do relacionamento (valor do enum) que ser� criado entre eles.

As interfaces Node e Relationship estendem a interface PropertyContainer, que define uma API comum para tratamento de propriedades para ambos os tipos. Portanto, para setar o valor de uma propriedade basta utilizar o m�todo setProperty(), passando como par�metro o nome da propriedade e seu valor. Do mesmo modo, � poss�vel recuperar o valor de uma propriedade atrav�s do m�todo getProperty(), passando como par�metro o nome desta propriedade.

Para efetivar as modifica��es feitas no grafo � necess�rio executar dois m�todos da interface Transaction. O primeiro � o success(), que apenas sinaliza que a transa��o est� em estado correto. J� o segundo m�todo, o finish(), � respons�vel por efetuar o commit no grafo. Caso algum problema ocorra e o m�todo success() n�o seja executado, o m�todo finish() ir� executar o rollback. Por fim temos o m�todo shutdown() da interface GraphDatabaseService, que encerra as opera��es do grafo.

Para compilar e rodar o c�digo da Listagem 6 execute os seguintes comandos no terminal (ou no prompt):


  $ javac TesteNeo4j.java -cp neo4j-kernel.jar
  (unix) $ java -cp neo4j-kernel.jar:geronimo-jta.jar:. TesteNeo4j
  (windows) C:\ java -cp neo4j-kernel.jar:geronimo-jta.jar;. TesteNeo4j

Utilizar a API do Neo4j � bastante simples, mas n�o a subestime. Com poucos recursos � poss�vel criar aplica��es bem complexas. Alguns exemplos de uso do Neo4j s�o a cria��o de motores de recomenda��o e an�lise de rotas de tr�nsito, onde ambos necessitam de uma an�lise detalhada de conex�es entre n�s, usando algoritmos como: n�s mais conectados ou menor rota entre dois n�s.

Outro recurso bastante �til do Neo4j � a exposi��o de dados no formato RDF (estrutura de dados padr�o do W3C para a web sem�ntica), que permite expressar modelos sem�nticos que podem ser consultados atrav�s da linguagem SPARQL. Veja a se��o Links para mais informa��es sobre o formato RDF e a linguagem SPARQL.

Cassandra

O Cassandra nasceu dentro do Facebook para lidar com as buscas nas caixas de entrada de mensagens de seus usu�rios. Inicialmente foi desenvolvido por Avinash Lakshman (um dos autores do paper sobre o Dynamo da Amazon) e por Prashant Malik. Em Julho de 2008 o Facebook liberou seu c�digo fonte e em mar�o de 2009 se tornou um projeto incubado dentro da funda��o Apache. Pouco menos de um ano depois a Apache o promoveu a um projeto top-level.

Seu modelo de dados � baseado em fam�lia de colunas e sua arquitetura � totalmente distribu�da, o que faz do Cassandra uma implementa��o do modelo de dados do BigTable com a arquitetura distribu�da do Dynamo. Como � escrito em Java, ele � capaz de ser executado em qualquer sistema operacional que tenha uma m�quina virtual instalada. No entanto, o Cassandra n�o disponibiliza nativamente uma interface para as aplica��es cliente, deixando esta fun��o a cargo do Thrift.

Thrift: � um framework de remote procedure call (RPC) criado pelo Facebook. Ele combina uma pilha de software com um mecanismo de gera��o de c�digo para criar servi�os que funcionem de forma eficiente e transparente para diversas linguagens, entre elas C++, C#, Java, Perl, Python, PHP, Erlang e Ruby � tradu��o da Wikip�dia.

Para instalar o Cassandra basta fazer o download da vers�o mais recente e est�vel (veja se��o Links) e descompactar o arquivo. � importante ressaltar que, assim como o MongoDB, o Cassandra s� deve ser colocado em produ��o em uma configura��o de cluster, onde os dados ser�o distribu�dos e replicados em mais de uma m�quina.

Colocar o servidor do Cassandra no ar, assim como todos os outros NoSQL que vimos, � uma tarefa bastante simples. Basta executar no terminal (ou no prompt) o comando sudo ./bin/cassandra (ou apenas bin\cassandra.exe no Windows). Dessa forma o servidor ir� gerar algumas mensagens no pr�prio console, conforme a Listagem 7. Caso tenha algum problema na execu��o, verifique as permiss�es do seu usu�rio (note que � necess�rio o comando sudo no ambiente *unix, pois o Cassandra utiliza algumas pastas de acesso restrito).

Listagem 7. Exemplo de sa�da gerada no console pelo Cassandra.

 INFO 18:27:30,555 DiskAccessMode 'auto' determined to be mmap, indexAccessMode is mmap
   INFO 18:27:30,868 Deleted /var/lib/cassandra/data/system/LocationInfo-13-Data.db
   INFO 18:27:30,869 Deleted /var/lib/cassandra/data/system/LocationInfo-14-Data.db
   INFO 18:27:30,870 Deleted /var/lib/cassandra/data/system/LocationInfo-15-Data.db
   INFO 18:27:30,885 Sampling index and loading saved keyCache for /var/lib/cassandra/data/system/LocationInfo-17-Data.db (0 saved keys)
   INFO 18:27:30,895 Deleted /var/lib/cassandra/data/system/LocationInfo-16-Data.db
   INFO 18:27:30,901 loading row cache for LocationInfo of system
   INFO 18:27:30,907 completed loading (6 ms; 0 keys)  row cache for LocationInfo of system
   INFO 18:27:30,909 loading row cache for HintsColumnFamily of system

A Listagem 8 mostra o c�digo Java necess�rio para adicionar e recuperar dados de uma coluna no Cassandra utilizando o driver Hector vers�o 0.6.0-15 (veja a refer�ncia em Links). Este driver � considerado a melhor forma de se conectar ao Cassandra atrav�s do Java.

Antes de explorar o c�digo da Listagem 8, � importante ressaltar que o keyspace, assim como suas fam�lias de colunas, deve estar previamente configurado no arquivo CASSANDRA_HOME/conf/storage-conf.xml. Por�m, neste c�digo de exemplo, � utilizado o Keypace1 e a fam�lia Standard1, que fazem parte da configura��o padr�o do Cassandra. Deste modo n�o � necess�rio se preocupar com nenhuma configura��o para executar este c�digo.

Listagem 8. C�digo Java utilizando o Hector para comunica��o com o Cassandra.

import static me.prettyprint.cassandra.utils.StringUtils.bytes;
  import static me.prettyprint.cassandra.utils.StringUtils.string;
  import me.prettyprint.cassandra.service.CassandraClient;
  import me.prettyprint.cassandra.service.CassandraClientPool;
  import me.prettyprint.cassandra.service.CassandraClientPoolFactory;
  import me.prettyprint.cassandra.service.Keyspace;
   
  import org.apache.cassandra.thrift.Column;
  import org.apache.cassandra.thrift.ColumnPath;
   
  public class TesteCassandra {
   
    public static void main(String[] args) throws Exception {
      // Obt�m uma inst�ncia do pool
      CassandraClientPool pool = CassandraClientPoolFactory.INSTANCE.get();
      // Solicita ao pool uma conex�o com o servidor
      CassandraClient client = pool.borrowClient("localhost", 9160);
      try {
        // Obt�m o Keyspace
        Keyspace keyspace = client.getKeyspace("Keyspace1");
        // Cria um ColumnPath para definir o caminho onde os
        // dados ser�o armazenados no keyspace
        ColumnPath columnPath = new ColumnPath();
        // Seta o nome da fam�lia de colunas
        columnPath.setColumn_family("Standard1");
        // Seta o nome da coluna desejada
        columnPath.setColumn(bytes("telefone"));
        // Adiciona na chave "porcelli" o valor "Alexandre Porcelli" na
        // coluna definida pela vari�vel columnPath
        keyspace.insert("porcelli", columnPath, bytes("1234-5678"));
   
        // Obt�m o valor da coluna definida pela vari�vel columnPath
        Column colValue = keyspace.getColumn("porcelli", columnPath);
        System.out.println("Telefone:" + string(colValue.getValue()));
      } finally {
        // Libera a conex�o
        pool.releaseClient(client);
      }
    }
  }

Neste c�digo de exemplo estabelecemos a conex�o com o Cassandra atrav�s do m�todo borrowClient() da interface CassandraClientPool (obtida atrav�s da factory CassandraClientPoolFactory). Os par�metros deste m�todo s�o o endere�o e n�mero da porta do servidor (�localhost� e 9160, respectivamente). Uma vez estabelecida a conex�o, este m�todo retorna uma inst�ncia da interface CassandraClient.

O pr�ximo passo � obter o keyspace (algo como um database do modelo de fam�lia de colunas), atrav�s do m�todo getKeyspace() da interface CassandraClient, passando como par�metro o nome desejado.

Depois de obter o keyspace, precisamos indicar o local (fam�lia e coluna) onde os dados ser�o inseridos. Para isso precisamos criar uma inst�ncia da classe ColumnPath. O m�todo setColumn_family() desta classe seta o nome da fam�lia que ser� utilizado. Em seguida � necess�rio especificar a coluna, que � justamente onde o dado ser� realmente armazenado.

Diferente das estruturas keyspace e fam�lia de colunas, uma coluna n�o necessita ser previamente definida. Portanto, caso a coluna n�o exista, ela ser� automaticamente criada. Para definir no ColumnPath qual � o nome da coluna, basta utilizar o m�todo ColumnPathsetColumn()

Grande parte dos m�todos que lidam com armazenamento e recupera��o de dados na API do Cassandra utiliza o formato Array de Bytes ao inv�s de String. Com o objetivo de facilitar a convers�o de String para Array de Bytes e de Array de Bytes para String, o Hector disponibiliza a classe StringUtils com os respectivos m�todos est�ticos: bytes() e string().

Agora que j� temos o Keyspace e o ColumnPath, podemos finalmente inserir um dado no Cassandra. O m�todo utilizado para tal � o insert() da interface Keyspace, que recebe como par�metro um identificador �nico, a inst�ncia do ColumnPath e o valor que ser� armazenado.

O identificador �nico � a chave que permite acessar qualquer coluna armazenada dentro da fam�lia de colunas. Veja a Figura 2 para entender melhor como os dados deste exemplo s�o estruturados no modelo de dados do Cassandra.

Estrutura de como os dados da
<b>Listagem 8</b> s�o armazenados no modelo
do Cassandra — **Figura 2**. Estrutura de como os dados da **Listagem 8** s�o armazenados no modelo do Cassandra.

Ap�s inserir o dado na coluna telefone, vamos executar uma consulta com o objetivo de recupera-lo. Para realizar esta opera��o utilizaremos o m�todo getColumn() da interface Keyspace, passando como par�metros o identificador �nico (�porcelli�) e a inst�ncia do ColumnPath. O retorno deste m�todo � uma inst�ncia da classe Column que, para obter o valor armazenado, precisamos executar o m�todo getValue().

Todas as opera��es de manipula��o de dados foram executadas dentro de um bloco try/finally com o objetivo de garantir que, ao final da execu��o, a conex�o com o servidor ser� liberada. Esta libera��o ocorre atrav�s da execu��o do m�todo releaseClient() da interface CassandraClientPool, que recebe como par�metro a inst�ncia da interface CassandraClient.

Para compilar e rodar o c�digo da Listagem 8 execute os comandos no terminal (ou no prompt) exibidos na Listagem 9.

Listagem 9. Comandos necess�rios para compilar e rodar o c�digo da Listagem 8.

unix:
  $ javac TesteCassandra.java -cp clhm-production.jar:hector-0.6.0-15-sources.jar:log4j-1.2.14.jar:commons-codec-1.4.jar:hector-0.6.0-15.jar:perf4j-0.9.12.jar:apache-cassandra-0.6.0.jar:commons-pool-1.5.3.jar:high-scale-lib.jar:slf4j-api-1.5.8.jar:cassandra-javautils.jar:google-collections-1.0.jar:libthrift-r917130.jar:slf4j-log4j12-1.5.8.jar
  $ java -cp clhm-production.jar:hector-0.6.0-15-sources.jar:log4j-1.2.14.jar:commons-codec-1.4.jar:hector-0.6.0-15.jar:perf4j-0.9.12.jar:apache-cassandra-0.6.0.jar:commons-pool-1.5.3.jar:high-scale-lib.jar:slf4j-api-1.5.8.jar:cassandra-javautils.jar:google-collections-1.0.jar:libthrift-r917130.jar:slf4j-log4j12-1.5.8.jar:. TesteCassandra
   
  windows:
  C:\ javac TesteCassandra.java -cp clhm-production.jar;hector-0.6.0-15-sources.jar;log4j-1.2.14.jar;commons-codec-1.4.jar;hector-0.6.0-15.jar;perf4j-0.9.12.jar;apache-cassandra-0.6.0.jar;commons-pool-1.5.3.jar;high-scale-lib.jar;slf4j-api-1.5.8.jar;cassandra-javautils.jar;google-collections-1.0.jar;libthrift-r917130.jar;slf4j-log4j12-1.5.8.jar
  C:\ java -cp clhm-production.jar;hector-0.6.0-15-sources.jar;log4j-1.2.14.jar;commons-codec-1.4.jar;hector-0.6.0-15.jar;perf4j-0.9.12.jar;apache-cassandra-0.6.0.jar;commons-pool-1.5.3.jar;high-scale-lib.jar;slf4j-api-1.5.8.jar;cassandra-javautils.jar;google-collections-1.0.jar;libthrift-r917130.jar;slf4j-log4j12-1.5.8.jar;. TesteCassandra

Com sua capacidade de armazenar grandes volumes de dados atrav�s de sua arquitetura distribu�da, aliada � baixa lat�ncia nas opera��es de manipula��o de dados, o Cassandra atende �s necessidades de aplica��es que precisam lidar com o chamado Big Data.

Em uma arquitetura complexa que utiliza cache sobre a base de dados, a utiliza��o do Cassandra � bastante vantajosa, pois ser� resolvido o problema de lat�ncia sem ter a necessidade de duplica��o de dados.

Como foi poss�vel observar neste artigo, em geral, colocar uma ferramenta NoSQL para funcionar e programar com sua API � muito simples. Diferentemente dos bancos de dados relacionais, n�o tivemos que criar usu�rios, definir permiss�es, entre tantas outras tarefas burocr�ticas. Com exce��o do Cassandra, at� mesmo a defini��o de esquemas n�o precisou ser feita. Do ponto de vista do desenvolvedor, estas ferramentas � se bem usadas � acabam trazendo muita agilidade e produtividade.

Por outro lado, colocar estas ferramentas em produ��o � bem mais complicado do que pode parecer. N�o existem muitas ferramentas para auxiliar na administra��o, e as dispon�veis s�o baseadas em linha de comando, o que torna ainda mais dif�cil a tarefa do administrador. Tamb�m temos que considerar o fato destas tecnologias serem jovens, e a todo o momento s�o encontrados bugs ou implementadas novas funcionalidades, o que exige um trabalho mais intenso de atualiza��o e manuten��o por parte dos sysadmins.

Algumas empresas viram nesta dificuldade de administra��o uma oportunidade de neg�cio, oferecendo o chamado Dados como Servi�o (ou DaaS), onde o desenvolvedor utiliza uma infraestrutura externa sem ter que se preocupar com os pormenores de administra��o.

Conclus�o

Este artigo mostrou como instalar e utilizar algumas das principais ferramentas NoSQL. Atrav�s delas pudemos entender, de forma menos abstrata, como os dados s�o estruturados nos diferentes modelos que emergiram dentro do movimento NoSQL (chave-valor, documento, grafo e fam�lia de colunas).

Um dos principais fatores de sucesso destas, e de grande parte das ferramentas NoSQL, deve-se ao modo elegante como suas APIs foram projetadas. Independente da complexidade interna que estas ferramentas implementam, suas funcionalidades s�o expostas aos desenvolvedores de modo bastante simplificado.

Por�m, vale ressaltar que estas tecnologias precisam evoluir um pouco mais para atingir certo n�vel de maturidade. Isso fica evidente quando nos deparamos com a falta de ferramental de apoio para a administra��o das mesmas. Mas, este caminho � natural, pois ocorreu de forma bastante semelhante com outras tecnologias, dentre elas os pr�prios bancos de dados relacionais.

Na terceira e �ltima parte desta s�rie de artigos, ser�o apresentados alguns casos pr�ticos em que a utiliza��o de uma solu��o NoSQL ser� mais vantajosa que a de um banco de dados relacional. Abordaremos tamb�m o tema persist�ncia poliglota e, para encerrar, ser�o dadas algumas dicas de como escolher a ferramenta NoSQL que melhor se adeque as suas necessidades.

Links

redis.io
P�gina principal do Redis.

github.com/xetorthio/jedis/downloads
P�gina de download da biblioteca Jedis.

mongodb.org
P�gina principal do MongoDB.

github.com/mongodb/mongo-java-driver/downloads
P�gina de download do driver do MongoDB para Java.

neo4j.org
P�gina principal do Neo4j.

w3.org/RDF
P�gina principal da especifica��o do formato RDF.

w3.org/TR/rdf-sparql-query
P�gina principal da especifica��o da linguagem SPARQL.

cassandra.apache.org
P�gina principal do Cassandra.

github.com/rantav/hector/downloads
P�gina de download do Hector, driver Java para o Cassandra.

s3.amazonaws.com/AllThingsDistributed/sosp/amazon-dynamo-sosp2007.pdf
Paper sobre o Dynamo da Amazon.

labs.google.com/papers/bigtable.html
P�gina do paper do BigTable.

cygwin.com
P�gina principal do Cygwin.

memcached.org
P�gina principal do Memcached.

nosql-database.org
Cat�logo das principais ferramentas noSQL.

Confira tamb�m

O que � Neo4j?

Curso

O que � Redis?

Curso

Curso de MongoDB

Curso

Confira outros conte�dos:

Por Alexandre Em 2011

Acelere seus resultados com o Prime.

Plano Start

12x R$89,00

Saiba mais

Plano Prime

12x R$199,00

Saiba mais

Plano Prime +

12x R$299,00

Saiba mais

Escolha seu Plano	Plano Start	Plano Prime	Plano Prime +
Forma��o completa Programador
Uso de IAs e automa��es
Exerc�cios gamificados
Projetos pr�ticos
Suporte ao conte�do
Comunidade de alunos
Cursos e artigos em +40 tecnologias
Trilha Monetize seu conhecimento
Mentoria T�cnica personalizada
Mentoria fazendo $ em 60 dias
Mentoria Primeiro emprego
Suporte humanizado 24 horas
Aulas exclusivas com especialistas
Mentorias mensais		2 por m�s	ilimitada
Tempo de assinatura	12 meses	12 meses	12 meses
	Saiba mais	Saiba mais	Saiba mais

Quero tirar uma d�vida

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Principais Ferramentas do NoSQL

Uso de novas ferramentas e conceitos relacionados ao armazenamento de dados. Neste artigo s�o exploradas algumas das principais ferramentas NoSQL, apresentando como instalar e utilizar cada uma delas atrav�s da linguagem Java.

Guia do artigo:

O que � NoSQL?

Redis

MongoDB

Neo4j

Cassandra

Conclus�o

Confira tamb�m

O que � Neo4j?

O que � Redis?

Curso de MongoDB

Confira outros conte�dos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para come�ar a atuar como programador?

Por que a programa��o se tornou a profiss�o mais promissora da atualidade?

Quais s�o os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programa��o atrav�s da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem hor�rio para as aulas?

Por que a DevMedia n�o usa videoaulas em sua did�tica?

Preciso de um computador espec�fico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais s�o os planos de assinatura dispon�veis?

Adquirindo o plano, terei acesso a todo o conte�do?

A plataforma tem planos vital�cios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

Como excluir meus dados da plataforma?