MongoDB: Realizando Consultas

Artigo do tipo Tutorial
Recursos especiais neste artigo:
Conte�do sobre boas pr�ticas.

Desvendando as consultas ao MongoDB
Este artigo aborda formas de consulta a dados tanto pelo Mongo Shell quando pela linguagem Java. Neste contexto, s�o apresentadas consultas dos tipos simples e avan�adas, o uso do framework de agrega��o e tamb�m da classe QueryBuilder. N�o menos importante, o artigo aborda ainda formas de conhecer o desempenho individual de cada consulta ao banco, assim como o uso de �ndices para melhorar o desempenho.

Em que situa��o o tema � �til
Este tema � �til para quem deseja come�ar a utilizar o banco de dados MongoDB e est� interessado em informa��es sobre desempenho e formas de desenvolver suas consultas.

Atualmente os bancos de dados NoSQL (Not Only SQL) passaram a estar em evid�ncia entre aplica��es de grande porte e grandes empresas que utilizam de algum modo o ambiente web, est�o aderindo com muito entusiasmo a este novo modelo. Esta escolha est� sendo feita por consequ�ncia de alguns fatores positivos oferecidos pelas solu��es NoSQL em rela��o aos bancos relacionais. Dentre estes fatores temos uma maior velocidade na pesquisa dos dados, menor espa�o f�sico em disco para armazenamento e f�cil escalabilidade, o que permite distribuir o banco de dados em v�rias m�quinas fazendo uso do particionamento de dados, tamb�m conhecido como Sharding.

Em busca de fatores positivos como estes, grandes empresas j� aderiram ao NoSQL, como a Google, Facebook, Twitter, Amazon.com, MTV Networks, Disney IMG, Cisco, entre outras. No Brasil, h� algum tempo, em um evento sobre o banco de dados NoSQL MongoDB, o especialista Franklin Amorim da Globo.com revelou que o MongoDB foi o banco de dados escolhido para o jogo online CartolaFC. Atualmente essa � a maior aplica��o da Globo.com, com mais de dois milh�es de usu�rios cadastrados e com um pico de aproximadamente 90 milh�es de p�ginas visualizadas em Junho de 2011. Normalmente, em seus projetos, a empresa usa como base de dados relacional o MySQL e a equipe da Globo.com revelou que encontrou algumas vantagens no uso do MongoDB sobre o MySQL. Entre elas, s�o citadas: a velocidade superior (2x mais r�pida que o MySQL), o acesso mais natural aos dados e a possibilidade de escalar a escrita de dados com Sharding (sistema de compartilhamento do MongoDB) � leia mais sobre isso no endere�o indicado na se��o Links.

O MongoDB � um banco de dados livre, desenvolvido pela empresa Norte Americana 10gen. O banco foi desenvolvido sobre o conceito de documentos e cole��es, onde cada cole��o armazena v�rios documentos. Nessa arquitetura poder�amos tentar relacionar uma cole��o a uma tabela e um documento a uma linha da tabela. Mas existem algumas diferen�as bem significativas entre elas como, por exemplo, o MongoDB n�o possui relacionamento entre cole��es, como existe entre tabelas de um banco relacional; os documentos s�o considerados din�micos, ou seja, voc� pode ter um documento com cinco campos ao mesmo tempo em que h� outros com tr�s ou seis campos, por exemplo; ao inv�s de ter um relacionamento entre tabelas, � poss�vel usar o conceito de documentos embutidos, ou seja, um documento dentro do outro.

Os documentos no MongoDB seguem o padr�o JSON (JavaScript Object Notation), e ap�s serem persistidos s�o transformados em BSON, um tipo de dado bin�rio e serializado pr�prio do MongoDB. Com o formato dos documentos em JSON, a manipula��o dos dados � realizada com base em chave (key) e valor (value), o que torna poss�vel o dinamismo entre documentos. Se, por exemplo, em uma cole��o qualquer, um novo documento a ser inserido conter entre suas chaves uma chave de valor nulo ou vazio, n�o � preciso inserir esta chave. Entretanto, em um momento futuro, quando existir um valor para tal chave, basta alterar o documento inserindo a chave e o valor e apenas este documento ir� sofrer as altera��es. Caso novas chaves sejam necess�rias, em virtude da necessidade de armazenar alguma nova informa��o, elas podem ser inseridas nos documentos conforme cada documento sofrer alguma altera��o como, por exemplo, um update. J� em um banco de dados relacional, voc� n�o teria essa facilidade, e precisaria criar uma instru��o SQL de altera��o da tabela para inserir uma nova coluna. Caso a nova coluna n�o tenha qualquer valor em algumas linhas, ela receberia o valor �null� nestas linhas. Este espa�o na coluna ocupado pelo �null� seria mantido pelo SGDB para um futuro dado, o que acaba consumindo espa�o f�sico em disco, e se este dado nunca for inserido, ent�o se perde muito espa�o em disco armazenando apenas o valor �null�.

No entanto o objetivo do artigo n�o ser� salvar documentos ou testar o espa�o gasto em disco para armazen�-los, e sim, explorar diretamente as queries, ou m�todos de consultas a dados a partir de c�digo Java e tamb�m pelo Shell do MongoDB. Dentre os m�todos de consulta temos as consultas simples (Simple Queries), consultas avan�adas (Advanced Queries), o framework de agrega��o (Aggregation Framework) e consultas do tipo QueryBuilder.

Todos esses tipos consultas ser�o apresentados no artigo por meio de exemplos pr�ticos em Java e tamb�m no mongo Shell. Al�m disso, ser� demonstrado como alcan�ar um melhor desempenho nas consultas com a adi��o de �ndices na cole��o de documentos e veremos tamb�m as ferramentas oferecidas pelo MongoDB para avalia��o de desempenho das queries. Uma cole��o com in�meros documentos ser� disponibilizada ao leitor para download, a qual ser� usada como exemplo para os testes das queries, juntamente com o c�digo fonte Java utilizado no projeto.

Conhecendo a cole��o Users

A cole��o Users cont�m os dados que ser�o usados como exemplo, na execu��o das queries, durante todo o artigo. Para obter esta cole��o � necess�rio acessar a se��o de downloads da Java Magazine, baixar o conte�do (arquivo contendo a cole��o) e fazer a importa��o para o banco de dados MongoDB. Os passos para realizar a importa��o ser�o demonstrados na se��o �Depend�ncias do Projeto�.

Antes de importar esta cole��o, no entanto, � importante conhecer a estrutura dos documentos que ela armazena. Para isso, observe a Listagem 1. Note que o documento � id�ntico a qualquer documento JSON, onde se tem um nome para a chave (key) e um determinado valor (value) para esta chave. Neste exemplo � poss�vel observar que a chave _id possui o valor 8, representando o identificador do documento, equivalente, por exemplo, � chave prim�ria (PK) de uma tabela em bancos de dados relacionais.

O identificador no MongoDB, conforme definido por padr�o, ser� sempre precedido por um underline. No documento da cole��o Users, existem outros campos al�m do _id, como as chaves name e age. A chave info � o que chamamos de documento interno (embedded document), ou sub-documento. Este tipo de documento normalmente � composto por pelo menos uma nova chave interna, e pode substituir a necessidade de se criar uma nova cole��o para armazenar as informa��es contidas nele.

Na cole��o Users, info possui as chaves internas hometown e job. Outra forma de armazenar dados em um documento Mongo � usando arrays, como exemplificado na chave preferences. Esta chave armazena valores sobre as prefer�ncias do usu�rio, como se fossem tags encontradas em sistemas de blog que identificam os principais assuntos de uma postagem.

Os documentos da cole��o Users foram gerados atrav�s de um processo rand�mico, podendo assim possuir documentos contendo nenhuma ou varias prefer�ncias para cada usu�rio. Isto foi feito propositalmente para que o leitor veja que um documento Mongo n�o precisa ter a estrutura id�ntica a todos os outros documentos da cole��o, como acontece, por exemplo, em tabelas de bancos de dados relacionais, onde todas as linhas de uma tabela sempre ter�o todas as colunas.

Listagem 1. Exemplo de um documento da cole��o Users.


{
          "_id" : 8,
          "name" : "Rodrigo Miranda Radel",
          "age" : 70,
          "info" : {
                  "hometown" : "Joao Pessoa",
                  "job" : "Comediante"
          },
          "preferences" : [
                  "Automobilismo",
                  "Basquete",
                  "Robotica"
          ]
  }

Agora observe a Listagem 2. Pode-se notar que o documento apresentado n�o possui a chave preferences, j� que o usu�rio n�o tem nenhuma prefer�ncia adicionada. Esta � uma grande vantagem encontrada no MongoDB que faz reduzir o consumo f�sico de mem�ria no disco r�gido. Se um campo n�o � utilizado, ao inv�s de ter este campo com um valor vazio ou mesmo nulo, ocupando um espa�o sem uma informa��o significante, � mais vantajoso n�o adicion�-lo no documento. Pode ser que para um banco de dados com dezenas, ou mesmo centenas de registros esta diferen�a nem seja percebida, mas quando trabalhamos com milhares ou milh�es de dados, a soma de v�rios campos sem informa��o alguma pode acabar resultando em muito espa�o f�sico desperdi�ado. E como um documento Mongo � considerado din�mico, a qualquer momento � poss�vel realizar uma altera��o neste documento e inserir as prefer�ncias do usu�rio. Tenha em mente que qualquer chave de um documento da cole��o Users pode ser omitido, exceto a chave _id, por possuir o mesmo papel de uma chave prim�ria em bancos relacionais.

Listagem 2. Documento sem a chave preferences.


{
          "_id" : 16,
          "name" : "Daniela Pinho Milito",
          "age" : 58,
          "info" : {
                  "hometown" : "Alagoinhas",
                  "job" : "Carpinteiro"
          }
  }

Depend�ncias do projeto

Por causa das depend�ncias do projeto que ser� constru�do neste artigo, ser�o necess�rios alguns downloads e tamb�m a instala��o do banco de dados MongoDB, como tamb�m a importa��o da cole��o Users. Para realizar o download do banco de dados, acesse o endere�o referente na se��o Links e fa�a o download da vers�o 2.2.2, conforme o seu sistema operacional. Fa�a tamb�m o download do mongo-java-driver.jar, a API fornecida pelo MongoDB para acesso Java ao banco de dados, o qual dever� ser adicionado a sua aplica��o. A URL para download do driver vers�o 2.10.1, usada no artigo, tamb�m pode ser encontrada na se��o Links.

A instala��o do banco de dados � muito simples, bastando realizar os seguintes passos (exemplo em Windows):

� Fa�a a descompacta��o do arquivo baixado;

� Copie o conte�do extra�do para o diret�rio c:\;

� Para facilitar a execu��o das instru��es futuras na linha de comando, altere o nome da pasta raiz descompactada para �mongo�;

� Entre no diret�rio c:\mongo\bin e copie todos os arquivos existentes. Cole estes arquivos em c:\mongo;

� Crie um novo diret�rio chamado �data� dentro do diret�rio c:\mongo. Este novo diret�rio ser� onde o MongoDB ir� armazenar o banco de dados.

Importando a cole��o Users

Chegou o momento da importa��o da cole��o Users para o MongoDB. Para isso, descompacte o arquivo users.rar e copie o seu conte�do (users.json) para o diret�rio c:\mongo. Em seguida abra uma janela do console do seu sistema operacional e navegue at� o diret�rio c:\mongo. Antes da importa��o da cole��o, no entanto, devemos inicializar o MongoDB executando o seguinte comando:

c:\mongo> mongod --dbpath data

O comando mongod � o respons�vel por inicializar o MongoDB, e o par�metro ��dbpath indica ao MongoDB onde est� armazenado o banco de dados, que neste caso � no diret�rio data. Se a inicializa��o ocorreu com sucesso, voc� ter� um retorno no console semelhante ao exibido na Listagem 3.

Listagem 3. Log de inicializa��o.


Thu Jan 03 16:52:19 [initandlisten] MongoDB starting : pid=4352 port=27017
 dbpath=data 64-bit host=MarcioBallem-PC
  Thu Jan 03 16:52:19 [initandlisten] db version v2.2.0, pdfile version 4.5
  Thu Jan 03 16:52:19 [initandlisten] git version:
 f5e83eae9cfbec7fb7a071321928f00d1b0c5207
  Thu Jan 03 16:52:19 [initandlisten] build info: 
  windows sys.getwindowsversion
 (major=6, minor=1, build=7601, platform=2, 
  service_pack='Service Pack 1')
 BOOST_LIB_VERSION=1_49
  Thu Jan 03 16:52:19 [initandlisten] options: { dbpath: "data" }
  Thu Jan 03 16:52:19 [initandlisten] journal dir=data/journal
  Thu Jan 03 16:52:19 [initandlisten] recover : 
  no journal files present, no recovery needed
  Thu Jan 03 16:52:22 [initandlisten] waiting 
  for connections on port 27017
  Thu Jan 03 16:52:22 [websvr] admin web console waiting for 
  connections on port 28017 ...

Fim do trecho gratuito • continue abaixo

CONTE�DO EXCLUSIVO