Entendendo o Banco de dados NoSQL

Por que eu devo ler este artigo:Bancos noSQL se referem a uma classe definida de banco de dados n�o-relacionais que rompem com uma longa hist�ria de banco de dados focados nas propriedades ACID. Para tornar ainda mais clara a diferen�a trazida por este novo paradigma, este artigo tamb�m realiza algumas an�lises comparativas entre bancos noSQL e relacionais.

Conhecer o novo paradigma que vem surgindo na �rea de banco de dados, noSQL, pode ser considerado muito importante para aqueles que trabalham com banco de dados ou tomadores de decis�o da �rea de tecnologia das organiza��es. � sempre importante estar atento a novas tecnologias e como elas resolvem problemas provenientes das limita��es das tecnologias existentes.

Uma breve introdu��o ao NoSQL em v�deo

Relacionado: Curso de NoSQL

Guia do artigo:

Hist�ria e caracter�stica do banco de dados relacional
Limita��es dos bancos de dados relacionais
Um novo paradigma: Banco de Dados NoSQL
Principais caracter�sticas dos Bancos de Dados NoSQL
Modelos de banco de dados NoSQL
Principais diferen�as entre SGBDs Relacionais e NoSQL
Conclus�o
Refer�ncias e Links �teis

Atrav�s deste artigo temos a pretens�o de apresentar de forma concisa os fundamentos, caracter�sticas e diferenciais dos bancos de dados NoSQL. Al�m disso, a autora deste artigo acredita ser de suma import�ncia apresentar os fundamentos relacionados ao Banco de Dados Relacional, assim como realizar diversas compara��es entre os dois modelos, para que haja uma melhor compreens�o e abstra��o deste novo paradigma chamado Banco de Dados NoSQL.

A forma como nos comunicamos, trocamos informa��es e criamos conte�do mudou muito ao longo dos anos. Estamos vivenciando uma �poca onde as aplica��es Web t�m revolucionado o mundo em diversos sentidos e a tend�ncia � que este crescimento habilite a cria��o de uma s�rie de novas aplica��es. O grande volume de dados gerados por estas aplica��es Web, aliado com a nova forma de intera��o com o usu�rio (din�mica, eficiente e intuitiva), a escalabilidade sob demanda e a necessidade de um alto grau de disponibilidade, tem fomentado o aparecimento de novos paradigmas e tecnologias.

Todos n�s sabemos que o banco de dados relacional tem sido usado h� muito tempo em larga escala pelo mundo afora, e desde sua cria��o, por volta do in�cio dos anos 1970, esse tem sido o tipo de banco de dados mais utilizado em empresas que possuem um intenso volume de dados para serem armazenados [1]. Pensando justamente neste imenso volume de dados que tende a crescer a cada momento, come�a a se observar que os bancos de dados relacionais possuem certos fatores limitantes, principalmente quando nos referimos a escalabilidade de um sistema [3]. Este ambiente envolto de limita��es que os bancos de dados relacionais t�m propiciado instigou o surgimento de outros tipos de modelos alternativos de banco de dados que possam suprir essa necessidade.

Diante de tantas dificuldades que s�o encontradas � medida que as necessidades surgem, est� crescendo uma nova gera��o de banco de dados que vem ganhando bastante for�a e espa�o, estes s�o conhecidos como NoSQL (�Not Only SQL�) [4], este � o termo gen�rico que define um banco de dados n�o-relacional. Este modelo veio com a proposta de atender e gerenciar os grandes volumes de dados, buscando um alto desempenho e disponibilidade. Neste contexto, neste artigo ser�o apresentadas caracter�sticas desses bancos de dados e se discute ainda como essas novas solu��es podem abordar quest�es que est�o sendo atualmente enfrentadas.

Hist�ria e caracter�stica do banco de dados relacional

O banco de dados relacional surgiu como um sucessor dos modelos hier�rquicos de rede. Estas estruturas, por sua vez, foram muito utilizadas nos primeiros sistemas de mainframe. No entanto, devido ao grande n�mero de restri��es de relacionar estruturas no mundo real, este modelo foi perdendo for�a para dar lugar aos bancos de dados relacionais [5]. Este, por �ltimo, se tornou o grande padr�o para a maioria dos Sistemas Gerenciadores de Banco de Dados (SGBDs). Outro ponto importante a salientar sobre o modelo relacional � a utiliza��o de restri��es de integridade que garantem a consist�ncia dos dados em um banco de dados. Estas restri��es, em sua grande maioria, s�o conhecidas como chaves prim�rias PRIMARY KEY e chaves estrangeiras FOREIGN KEY.

Outra caracter�stica que devemos ressaltar no Modelo Relacional � o que chamamos de processo de Normaliza��o. Seu objetivo � a aplica��o de uma s�rie de passos com determinadas regras sobre a tabela do banco de dados de forma a garantir o projeto adequado dessas tabelas. Um conceito b�sico da normaliza��o consiste na separa��o de dados referentes a elementos distintos em tabelas distintas, associadas atrav�s da utiliza��o das chaves. Essas regras permitem um armazenamento consistente e, al�m disso, um eficiente acesso aos dados, reduzindo redund�ncias e diminuindo as chances dos dados se tornarem inconsistentes [7].

Al�m disso, o modelo relacional come�ou a adotar uma linguagem para a manipula��o e consulta destes dados. Estamos nos referindo ao SQL (Structured Query Language). Criada originalmente pela IBM e inspirada na �lgebra relacional, ganhou grande destaque pela facilidade do seu uso, diferenciando-a assim de todas as outras linguagens procedurais da �poca. Devido a sua grande utiliza��o em 1982, o American National Standard Institute (ANSI) tornou o SQL o padr�o oficial de linguagem em ambiente relacional, consolidando assim a sua posi��o de domin�ncia no modelo relacional [1].

N�o � poss�vel falar de SQL sem falar tamb�m do SGBD, que se caracteriza como um conjunto de programas que permitem armazenar, modificar e extrair em um banco de dado. Falando mais atentamente sobre o assunto, podemos afirmar que o SGBD oferece aos seus usu�rios processos de valida��o, recupera��o de falhas, seguran�a, otimiza��o de consultas, garantia de integridade dos dados, entre outros [8].

Al�m disso, os SGBDs Relacionais oferecem a possibilidade de v�rios usu�rios acessarem e manipularem um mesmo banco de dados simultaneamente e principalmente de forma eficiente, algo que � fundamental em sistemas de grande porte.

Os SGBDs relacionais ainda possuem a possibilidade do sistema se recuperar adequadamente de poss�veis falhas, ou seja, ele tem a capacidade de voltar ao ponto anterior em que ocorreu a falha, permitindo assim um banco de dados mais consistente.

Vale ressaltar ainda que os bancos de dados relacionais seguem o modelo ACID para preservar a integridade de uma transa��o. Este conjunto de procedimentos � dividido em quatro propriedades, e s�o elas:

Atomicidade: As a��es que comp�e a a��o da transa��o devem ser conclu�das com sucesso para ser efetivada. Se esta transa��o falhar, ser� feito o rollback.
Consist�ncia: Todas as regras/restri��es descritas no banco de dados devem ser obedecidas garantindo que o banco de dados passe de uma forma consistente para outra forma consistente.
Isolamento: Neste caso, a propriedade de isolamento garante que a transi��o n�o ser� interferida por nenhuma outra transa��o concorrente.
Durabilidade: Os resultados de uma transa��o s�o permanentes, ou seja, o que foi salvo n�o ser� mais perdido.

Todos esses diferentes recursos auxiliaram a manter os SGBDs Relacionais sempre em uma posi��o de predomin�ncia entre os mais diversos tipos de ambientes computacionais, mas ao mesmo tempo, n�o impediu o aparecimento de determinados problemas, isso devido ao grande crescimento do volume de dados presente nos bancos de dados de algumas organiza��es.

Limita��es dos bancos de dados relacionais

Nos dias de hoje, o volume de dados de certas organiza��es, como podemos citar o caso do Facebook, que atingiu o n�vel de petabytes (em 2011 este volume de dados ultrapassou 30 petabytes (30 mil terabytes), sendo que menos de um ano antes o volume era de 20 petabytes). Este � um exemplo real de como esse crescimento de dados tem expandido rapidamente [11]. No caso destes tipos de organiza��es, a utiliza��o dos SGBDs relacionais tem se mostrado muito problem�tica e n�o t�o eficiente.

Os principais problemas encontrados com a utiliza��o do Modelo Relacional est�o principalmente na dificuldade de conciliar o tipo de modelo com a demanda da escalabilidade que est� cada vez mais frequente.

Podemos tomar como exemplo o pr�prio Facebook. Digamos que se o sistema est� rodando sobre um SGBD relacional e houver um crescimento do n�mero de usu�rios, consequentemente haver� uma queda de performance. E para superar este problema seria necess�rio fazer um upgrade no servidor ou aumentar o n�mero de servidores.

Se o n�mero de usu�rios continuasse a crescer intensamente, tais solu��es apresentadas n�o se mostrariam suficientes, pois o problema passa a se concentrar no acesso � base de dados. Neste caso, o que poderia ser feito para resolver este problema de escalabilidade seria aumentar o poder do servidor, aumentando sua mem�ria, processador e armazenamento. Este tipo de solu��o � chamado de Escalabilidade Vertical. Por outro lado, poder�amos aumentar o n�mero de m�quinas no servidor web, chamamos esta alternativa de Escalabilidade Horizontal [13].

Vamos citar novamente o Facebook, onde suas aplica��es continuam sempre a crescer, chega um momento em que o banco de dados n�o consegue atender todas as requisi��es em um tempo h�bil. Neste momento poder�amos apelar para a Escalabilidade Vertical e fazer o upgrade na m�quina em que est� rodando o banco de dados. No entanto, chega um momento em que a capacidade da m�quina chega ao limite do or�amento para conseguir uma m�quina realmente eficiente. Dessa forma, o pr�ximo passo seria utilizar a Escalabilidade Horizontal, ou seja, colocar mais m�quinas rodando o banco de dados. Tal tarefa pode parecer simples, por�m, no momento em que escalonamos o banco em diversas m�quinas � necess�rio realizar na grande maioria das vezes uma s�rie de configura��es e altera��es nas aplica��es para que tudo funcione como esperado na nova arquitetura distribu�da.

Ainda no campo dos exemplos, vamos imaginar um sistema fict�cio, e que n�o se sabe ao certo os campos de determinada entidade, agora imagine este mesmo sistema do dia para a noite sendo acessado por milhares e milhares de pessoas. No outro dia, ao observar sua caixa de email voc� percebe que diversos usu�rios possuem ideias realmente inovadoras, por�m, para implementar essas ideias no seu sistema � necess�rio que o banco de dados praticamente por inteiro seja refatorado, afinal, ser� necess�rio realizar diversas mudan�as estruturais na base de dados . Com este problema em m�os podemos perceber que o Modelo Relacional est� focado nos relacionamentos entre as entidades e que isso, por muitas vezes, torna mais �burocr�tica� a implementa��o de novas funcionalidades, al�m dos problemas voltados para a escalabilidade que j� hav�amos falado, quando h� um acesso muito grande de usu�rios ao sistema.

Como esse intenso volume de dados vem aumentando e pela sua natureza estrutural, os desenvolvedores perceberam a dificuldade ao se organizar dados no Modelo Relacional. � neste ponto que o foco das solu��es n�o-relacionadas est� direcionado.

Um novo paradigma: Banco de Dados NoSQL

Pensando em solucionar diversos problemas relacionados � escalabilidade, performance e disponibilidade, projetistas do NoSQL promoveram uma alternativa de alto armazenamento com velocidade e grande disponibilidade, procurando se livrar de certas regras e estruturas que norteiam o Modelo Relacional. Se por um lado havia um rompimento das regras do Modelo Relacional, por outro lado havia ganho de performance, flexibilizando os sistemas de banco de dados para as diversas caracter�sticas que s�o peculiares de cada empresa. Esta flexibilidade passou a se tornar fundamental para suprir os requisitos de alta escalabilidade necess�rios para gerenciar grandes quantidades de dados, assim como para garantir uma alta disponibilidade destes, caracter�stica fundamental para as aplica��es Web 2.0. Algumas grandes organiza��es passaram a investir em seus pr�prios SGBDs baseando-se na ideia do NoSQL.

O termo NoSQL foi inicialmente utilizado em 1998 a partir de uma solu��o que n�o oferecia uma interface SQL, mas este sistema tinha como base o Modelo Relacional. Futuramente, o modelo passou a representar determinadas solu��es que se tornavam melhores que a utiliza��o do Modelo Relacional, desde ent�o passou a utilizar a abrevia��o Not Only SQL (N�o apenas SQL) [13]. A proposta dos bancos NoSQL na realidade n�o � extinguir o Modelo Relacional, mas utiliz�-lo em casos onde � necess�ria uma maior flexibilidade na estrutura��o do banco.

Este movimento est� bastante enraizado no open source. E apesar de existirem muitos bancos de dados nesta categoria, o movimento passou a ganhar mais for�a quando determinadas empresas consideradas gigantes da tecnologia passaram a utilizar suas pr�prias implementa��es propriet�rias [14]. Neste caso, podemos citar o Google, que desde 2004 investe no BigTable que foi desenvolvido para suprir as necessidades de armazenamento da empresa, baseado na filosofia do alto desempenho, escalabilidade e disponibilidade [15]. Al�m disso, temos tamb�m o famoso Cassandra, desenvolvido pelo Facebook para lidar com o grande fluxo de informa��es [16]. Em 2010 o Cassandra mostrou ser um banco de dados consolidado e passou a ser utilizado pelo Twitter, que utilizava o MySQL anteriormente [17].

Temos ainda o Apache CouchDB, que � um banco de dados open source orientado a documentos que projetado especialmente para suportar computa��o distribu�da em larga escala [18].

Apesar da nomenclatura de todos esses bancos de dados serem NoSQL, eles n�o s�o completamente iguais, possuem na verdade muitas caracter�sticas semelhantes e muitas particularidades que os diferenciam.

Principais caracter�sticas dos Bancos de Dados NoSQL

Os bancos de dados NoSQL apresentam determinadas caracter�sticas que considero importantes de serem consideradas neste artigo, al�m disso, s�o essas caracter�sticas que os tornam t�o diferentes dos bancos de dados relacionais. Algumas dessas caracter�sticas s�o:

Escalabilidade Horizontal: na medida em que o volume de dados cresce, aumenta-se a necessidade de escalabilidade e melhoria do desempenho. Dentre todas as possibilidades para esta solu��o, a escalabilidade horizontal se torna a mais vi�vel, por�m requer diversas threads ou que processos de um tarefa sejam criadas e distribu�das. Dessa forma, o uso de um banco de dados relacional poderia ser muito complexo. N�o queremos dizer que os bancos de dados relacionais n�o escalam, a verdade � que eles n�o escalam facilmente. Isto por que no momento em que diversos processos se conectam simultaneamente em um mesmo conjunto de dados h� uma gera��o de uma alta concorr�ncia aumentando assim o tempo de acesso �s tabelas. Neste contexto, uma grande vantagem dos bancos NoSQL � justamente a aus�ncia de bloqueios, o que permite a escalabilidade horizontal com uma maior facilidade e efici�ncia (ele n�o � afetado pelo aumento da concorr�ncia). Uma alternativa muito utilizada para alcan�ar a escalabilidade horizontal � o Sharding, que divide os dados em m�ltiplas tabelas a serem armazenadas ao longo de diversos n�s na rede. O que esta t�cnica faz, na realidade, � romper a cadeia de relacionamentos, que � uma forte caracter�stica nos bancos relacionais. � poss�vel realizar o Sharding em banco de dados relacionais de forma manual. Entretanto, esta n�o � uma tarefa simples e demonstra complexidade de implementa��o para a equipe que est� desenvolvendo [12].
Aus�ncia de esquema (Schema-free) ou esquema flex�vel: Outra caracter�stica not�vel em bancos de dados NoSQL � a aus�ncia parcial ou total de esquema que define a estrutura de dados. � justamente essa aus�ncia de esquema que facilita uma alta escalabilidade e alta disponibilidade, mas em contrapartida n�o h� a garantia de integridade dos dados, fato este que n�o ocorre no Modelo Relacional [20].
Suporte nativo a replica��o: Esta � outra forma de prover a escalabilidade, pois, no momento em que permitimos a replica��o de forma nativa o tempo gasto para recuperar informa��es � reduzido [21].
API simples para acessar o banco de dados: Em banco de dados NoSQL, o foco n�o est� no armazenamento dos dados e sim como recuperar estes dados de forma eficiente. Pensando nisso, � fundamental APIs desenvolvidas para facilitar o acesso �s devidas informa��es para que se possa usar o banco de dados de forma r�pida e eficiente.
Consist�ncia eventual: Outra caracter�stica particular de bancos NoSQL � que nem sempre a consist�ncia dos dados � mantida. Esta caracter�stica tem embasamento no teorema CAP (Consistency, Availability e Partition tolerance) que afirma que em um dado momento s� � poss�vel garantir duas destas tr�s propriedades, que seriam Consist�ncia, Disponibilidade e toler�ncia � parti��o [32]. No mundo real, normalmente estas duas �ltimas s�o privilegiadas. Como consequ�ncia disto, as propriedades do ACID n�o s�o respeitadas simultaneamente, ao contr�rio disto, temos outro conjunto de projetos denominado BASE (Basicamente dispon�vel, Estado leve e consistente em momento indeterminado) [21]. Ou seja, � necess�rio haver um planejamento para que o sistema possa tolerar inconsist�ncias tempor�rias com o objetivo de priorizar a disponibilidade.

Agora que falamos brevemente sobre as principais caracter�sticas nos bancos de dados NoSQL, � importante ressaltar algumas t�cnicas utilizadas para a implementa��o de suas funcionalidades. Entre elas est�o:

Map/reduce: permite a manipula��o de enormes volumes de dados ao longo de n�s em uma rede [23]. Funciona da seguinte forma: na fase map, os problemas s�o particionados em pequenos problemas que s�o distribu�dos em outros n�s na rede. Quando chegam � fase reduce, esses pequenos problemas s�o resolvidos em cada n� filho e o resultado � passado para o pai, que sendo ele consequentemente filho, repassaria para o seu, at� chegar � raiz do problema.
Consistent hashing: suporta mecanismos de armazenamento e recupera��o, onde a quantidade de sites est� em constante mudan�a [24]. � interessante usar essa t�cnica, pois ela evita que haja uma grande migra��o de dados entre estes sites, que podem ser alocados ou desalocados para a distribui��o dos dados.
MVCC (Multiversion concurrency control): Oferece suporte a transa��es paralelas em banco de dados. Por n�o fazer uso de locks para controle de concorr�ncia, faz com que transa��es de escrita e leitura sejam feitas simultaneamente [25].
Vector clocks: Ordenam eventos que ocorreram em um sistema. Como existe a possibilidade de v�rias opera��es estarem acontecendo simultaneamente, o uso de um log de opera��es informando suas datas se faz importante para informar qual vers�o de um dado � a mais atual [21].

Modelos de banco de dados NoSQL

Neste caso, temos quatro categorias do NoSQL que as diferenciam entre si:

Chave-valor (key-value): Este modelo � considerado simples e permite a sua visualiza��o atrav�s de uma tabela de hash, no qual h� uma chave �nica e um indicador de determinado dado, podendo ser uma String ou um bin�rio [27]. A Figura 1 apresenta um exemplo que armazena informa��es com estas caracter�sticas. A chave representa um campo como nome e idade e o valor representam os campos preenchidos com Mara R�bia e 43, ou seja, a inst�ncia para o campo correspondente. Este modelo � caracterizado pela sua facilidade ao ser implementado, permitindo que os dados sejam acessados rapidamente atrav�s da chave, aumentando tamb�m a disponibilidade do acesso aos dados. Para manipul�-los, utilizamos comandos simples como get() e set(), que retornam e capturam valores. Um problema enfrentado por este tipo de banco de dados � que o mesmo n�o permite a recupera��o de objetos atrav�s de consultas mais complexas. Como exemplo, podemos citar o Dynamo que foi desenvolvido pela Amazon como solu��o de alta disponibilidade para suas necessidades [28].
Figura 1. Campos e informa��es
Banco de Dados Orientado a Documento: Como o pr�prio nome sugere, este modelo armazena cole��es e documentos. Explicando melhor, um documento, no geral, � um objeto identificador �nico e um conjunto de campos que podem ser strings, listas ou documentos aninhados [27]. Diferente do banco de dados chave-valor onde se cria uma �nica tabela hash, neste modelo temos um agrupamento de documentos sendo que em cada um destes documentos temos um conjunto de campos e o valor deste campo. Neste modelo temos aus�ncia de esquema pr�-definido (schema free). Isto significa que � poss�vel que haja atualiza��es no documento, com a adi��o de novos campos, por exemplo, sem afetar adversamente outros documentos. Outra caracter�stica interessante � que n�o � necess�rio armazenar valores de dados vazios para campos que n�o possuem um valor. Na Figura 2 temos o exemplo de um determinado documento que foi definido por: Assunto, Autor, Data, Tags e Mensagens. Caso eu deseje implementar outro campo chamado �Minha opini�o sobre o site:�, n�o haver� nenhum tipo de restri��o ou complexidade de inserir tal dado no banco de dados, esta flexibilidade � um ponto forte neste tipo de modelo. Como exemplo de sistema de banco de dados que utiliza este tipo de solu��o destacamos o CouchDB e o MongoDB. O CouchDB utiliza o formato JSON e � implementado em Java. J� o mongo � implementado em C++ e permite tanto concorr�ncia quanto replica��o.
Figura 2. Documento com informa��es
Orientado a Coluna (column family): Demonstra maior complexidade que o de chave-valor. Este tipo de banco de dados foi criado para armazenar e processar uma grande quantidade de dados distribu�dos em diversas m�quinas. Aqui existem as chaves, mas neste caso, elas apontam para atributos ou colunas m�ltiplas. Neste caso, os dados s�o indexados por uma tripla (coluna, linha e timestamp), a coluna e linha s�o identificadas por chaves e o timestamp permite diferenciar m�ltiplas vers�es de um mesmo dado [14]. Como o pr�prio nome sugere, as colunas s�o organizadas por fam�lia da coluna. Vale destacar que as opera��es de escrita e leitura s�o at�micas, ou seja, os valores associados a uma linha s�o considerados em sua execu��o, independente das colunas que est�o sendo lidas/escritas. O conceito associado a este modelo � o de fam�lia de colunas, com o objetivo de reunir colunas que armazenam o mesmo tipo de informa��o. Como exemplo, a Figura 3 modela o conceito de amigos, onde o primeiroNome e sobrenome s�o colunas pertencentes � fam�lia de colunas denominada �nome�. Da mesma forma, as colunas endere�o, cidade e estado pertencem � fam�lia local. � interessante observar que na linha 001 a pessoa Mara tem diversos endere�os. Como a busca neste tipo de banco de dados � at�mica, mesmo que o interesse seja buscar o primeiroNome da linha 001, todas as colunas ser�o retornadas quando esta mesma linha for consultada. Este modelo permite ainda o particionamento de dados, oferecendo forte consist�ncia, no entanto, a alta disponibilidade � o seu ponto fraco. Este modelo de dados surgiu com o BigTable criado pelo Google [15]. Al�m do BigTable temos tamb�m o Cassandra que foi desenvolvido pelo Facebook [16].
Figura 3. Representa��o de amigos
Orientado a Grafos: este modelo possui tr�s componentes b�sicos: n�s (v�rtices dos grafos), os relacionamentos (arestas) e as propriedades (conhecidos tamb�m como atributos). Este modelo � visto como multigrafo rotulado e direcionado, onde cada par de n�s pode ser conectado por mais de uma aresta. A utiliza��o deste modelo � muito �til quando � necess�rio fazer consultas demasiadamente complexas. O modelo orientado a grafos possui uma alta performance, permitindo um bom desempenho nas aplica��es [27]. Para exemplificar o que foi dito, podemos analisar a Figura 4 que representa uma aplica��o que mant�m informa��es relativas � viagem. Uma consulta pertinente seria: �Quais cidades foram visitadas anteriormente por pessoas que foram para Nova Iorque?�. No modelo de banco de dados relacional tal consulta poderia se mostrar complexa, pois n�o permitem que os dados sejam representados de uma forma natural.

Como exemplo, podemos citar o Neo4j que � um banco de dados open source. O Neo4J trata-se de um banco de dados baseado em grafos desenvolvido em Java. Al�m de possuir suporte completo para transactions, ele tamb�m trabalha com n�s e relacionamentos. Ainda no exemplo da Figura 4, temos diversas pessoas: Jo�o, Ricardo, Carolina, Maria, Fernando e F�bio que representam n�s do grafo e est�o conectadas a cidades que visitaram ou residiram. Por exemplo: Ricardo viajou para Roma e Bruxelas e j� residiu em Toronto e Paris. A partir de cada cidade, precisamos dos relacionamentos de entrada que tamb�m sejam do tipo �viajou� e com isso encontramos pessoas que viajaram para o mesmo lugar que Ricardo, neste caso, Carolina e Fernando.

Levando em considera��o tudo o que foi dito, � fundamental ressaltar que nenhum modelo � superior a outro. Na realidade, o que ocorre � que um modelo pode ser mais adequado para ser utilizado em certas situa��es. Por exemplo, para a utiliza��o de um banco de dados de manipula��o de dados que frequentemente ser�o escritos, mas n�o lidos (um contador de hits na Web, por exemplo), pode ser usado um banco de dados orientado a documento como o MongoDB. J� aplicativos que demandam alta disponibilidade, onde a minimiza��o da atividade � essencial, podemos utilizar um modelo orientado a colunas como o Cassandra. Aplica��es que exigem um alto desempenho em consultas com muitos agrupamentos podem utilizar um modelo orientado a grafos.

O importante � que no momento da cria��o do aplicativo os desenvolvedores utilizem a melhor solu��o que se encaixa no perfil desejado. Utilizar a solu��o adequada ao criar o banco de dados significa uma diminui��o dos custos para a sua cria��o, assim como um banco eficiente no processamento de dados do ponto de vista das suas necessidades.

Principais diferen�as entre SGBDs Relacionais e NoSQL

A partir do momento em que se pensa na possibilidade de utilizar um banco de dados NoSQL ao inv�s de um modelo relacional, � preciso levar algumas quest�es em considera��o, como crit�rios de escalonamento, consist�ncia e disponibilidade de dados. Vamos apresentar algumas discuss�es comparativas mais marcantes no que se diz respeito a estes tr�s conceitos.

Falar sobre escalabilidade � essencial porque � neste aspecto que os bancos de dados NoSQL possuem uma grande vantagem em rela��o aos SGBDs tradicionais, basicamente por terem sido criados para essa finalidade. Os bancos de dados relacionais possuem uma estrutura��o que n�o a permite tanta flexibilidade, al�m disso, � menos adaptada para situa��es em que o escalonamento se faz necess�rio.

Para alcan�ar uma melhor escalabilidade, os bancos de dados relacionais utilizam o recurso da escalabilidade vertical (scale up) que tem como caracter�stica a simplicidade de sua implementa��o e esta tem sido a forma mais indicada para se realizar o escalonamento do banco de dados. A partir do momento em que uma aplica��o est� sendo demasiadamente acessada por um n�mero muito grande de usu�rios, este tipo de escalonamento passa a n�o ser mais suficiente. O pr�ximo passo consiste em escalonar o pr�prio banco de dados, que consiste basicamente em distribuir o banco em v�rias m�quinas, particionando os dados. Conhecido tamb�m como sharding ou escalonamento horizontal. Esse tipo de escalonamento se mostra muito complexo ao ser implementado em um SGBD relacional devido � dificuldade em se adaptar a toda estrutura l�gica do Modelo Relacional, primeiro porque os SGBDs relacionais obedecem aos crit�rios de normaliza��o e o processo de sharding vai contra a tudo isso, pois se caracteriza pela desnomarliza��o dos dados. Segundo ponto, h� uma mudan�a de paradigma em rela��o ao processo de escalonamento. Enquando SGBDs tradicionais trabalham para refor�ar o servidor, o sharding tem como objetivo trabalhar com o escalonamento horizontal, distribuindo seus dados em diversos setores. Terceiro ponto, o volume de dados por m�quina � minimizado devido a esta distribui��o, afinal, conjunto de dados menores s�o mais simples de serem gerenciados, acessados e atualizados. Por �ltimo, a disponibilidade do sistema � otimizada em rela��o ao modelo relacional, pelo fato de que se houver a queda do sistema em uma m�quina n�o ir� causar a interrup��o do mesmo.

Esta quest�o da disponibilidade demonstra muita preocupa��o em determinadas organiza��es. Podemos citar um evento que ocorreu em 2008, em que a rede social Twitter ficou fora do ar durante 84 horas, neste evento o Twitter ainda utilizava o PostgreSQL, sendo considerada a rede social mais inst�vel daquele ano [30]. A partir de 2009, quando come�ou a utilizar o Cassandra, outro evento similar ocorreu, por�m o site ficou fora dor ar durante 23 horas e 45 minutos [17].

Neste quesito, o banco de dados NoSQL se destaca pela maior disponibilidade, maior rapidez nas consultas, paralelismo de atualiza��o de dados e maior grau de concorr�ncia.

Os bancos de dados NoSQL foram projetados para este fim, e da forma mais simples e natural poss�vel. Como exemplo podemos citar o MongoDB que inclui um m�dulo de sharding autom�tico que permite a constru��o de um cluster de banco de dados escalado horizontalmente para, dessa forma, incorporar novas m�quinas de forma din�mica [19].

Outra coisa que devemos notar ao fazer a compara��o de uma banco de dados relacional e NoSQL � no que se refere ao controle de concorr�ncia. Se por um lado, no Modelo Relacional utilizamos locks para garantir que dois usu�rios n�o acessem o mesmo item simultaneamente, no banco de dados NoSQL utilizam-se outras estrat�gias que acabam por permitir um maior grau de concorr�ncia. Para citar uma dessas estrat�gias podemos citar como exemplo o banco de dados CouchDB que utiliza o MMVC. A ideia principal � criar diversas vers�es dos documentos e permitir a atualiza��o sobre uma dessas vers�es mantendo ainda a vers�o desatualizada. Agindo dessa forma n�o h� a necessidade de bloquear os itens dos dados.

Ao se pensar em substituir um banco de dados relacional por um NoSQL, a arquitetura fica vulner�vel � perda de consist�ncia, por�m, pode-se ganhar em flexibilidade, disponibilidade e performance. Outra coisa interessante para ser destacada s�o as diferen�as de paradigmas utilizadas no Modelo Relacional e nos bancos NoSQL. No que diz respeito a este primeiro, temos o ACID que for�a a consist�ncia ao final de cada opera��o, j� o paradigma BASE, que � utilizado comumente pelo segundo, permite que o banco de dados eventualmente seja consistente, ou seja, o sistema s� torna-se consistente no seu devido momento.

Para compreendermos melhor todas essas diferen�as, observe a Tabela 1 que exemplifica de forma concisa alguns dos conceitos descritos neste artigo.

	Banco de Dados Relacional	Banco de Dados NoSQL
Escalonamento	� importante lembrar que � poss�vel ser feito o escalonamento em um Modelo Relacional, no entanto, � muito complexo. Possui uma natureza estruturada, portanto, a inser��o din�mica e transparente de novos n�s a tabela n�o � realizada naturalmente.	N�o possui um esquema pr�-definido fazendo com que este tipo de modelo seja flex�vel o que favorece a inser��o transparente de outros elementos.
Consist�ncia	Neste quesito, o Modelo Relacional se mostra forte. As suas regras de consist�ncia s�o bastante rigorosas no que diz respeito � consist�ncia das informa��es.	� realizada eventualmente no modelo: tem apenas a garantia que se n�o houver nenhuma atualiza��o nos dados, todos os acessos aos itens devolver�o o �ltimo valor que foi atualizado.
Disponibilidade	Por n�o conseguir trabalhar de forma eficiente com a distribui��o de dados, o Modelo Relacional acaba n�o suportando uma demanda muito grande de informa��es.	Outro ponto forte neste modelo � o que diz respeito � disponibilidade, pois possui um alto n�vel de distribui��o de dados, permitindo assim que seja poss�vel fazer com que um enorme fluxo de solicita��es aos dados seja atendido com a vantagem do sistema ficar indispon�vel o menor tempo poss�vel.

Tabela 1. An�lise comparativa entre Banco de Dados Relacional e NoSQL

Conclus�o

Com o grande crescimento do volume de dados em determinadas organiza��es, os bancos de dados NoSQL tem se tornado uma grande alternativa quando nos referimos a escalabilidade e disponibilidade, fatores estes que se tornam imprescind�veis em algumas aplica��es Web.

Para realizar a migra��o de um SGBD Relacional para um banco de dados NoSQL � preciso levar diversos fatores em considera��o. A empresa em quest�o deve mensurar as diversas vantagens e desvantagens propostas por ambos os modelos, e estes crit�rios de compara��o s�o dos mais diversos tipos, indo desde a escalabilidade do sistema, passando por avalia��o sobre consist�ncia de dados e qu�o importante � a disponibilidade do banco de dados para o sistema.

Em rela��o a bancos de dados relacionais, sabemos da sua �experi�ncia� no mercado, no qual � utilizado em larga escala. Al�m disso, sabemos da solidez de suas solu��es que s�o mais maduras e experimentadas. Enquanto isso, os bancos de dados NoSQL ainda est�o conquistando seu espa�o no mercado e definindo os seus pr�prios padr�es. Al�m disso, sabemos que para diversas organiza��es a consist�ncia de dados se torna um fator determinante e as transa��es atrav�s dos SGBDs Relacionais s�o a melhor alternativa para lidar com esse problema.

Por outro lado, temos o problema do grande volume de dados enfrentado por diversas empresas, assim como a necessidade que estes sistemas estejam dispon�veis para os seus usu�rios. Nestas situa��es, os bancos de dados NoSQL acrescentam diversos pontos positivos, primeiro pela sua possibilidade de escalonamento e pela simplicidade do seu modelo, onde n�o h� esquemas pr�-definidos, e segundo pela exist�ncia de uma grande distribui��o de dados, oferecendo assim um maior suporte de solicita��es a estes dados para serem atingidos. Adicionalmente, � importante ressaltar que uma escalabilidade em alto grau se faz necess�ria a empresas que utilizam um banco de dados de grande porte e onde a disponibilidade � um fator decisivo. Acredito que a utiliza��o de um banco de dados NoSQL onde a escalabilidade e a disponibilidade n�o se demonstre determinante, ainda � algo que � necess�rio discutir.

Neste sentido, este artigo teve a finalidade de explicar as principais caracter�sticas dos bancos de dados NoSQL e de forma mais concisa o banco de dados Relacional, assim como realizar algumas an�lises comparativas entre estes dois modelos que atualmente disputam e complementam o mercado. Ressaltando que n�o existe um banco de dados superior ao outro, a decis�o do uso de cada um se refere � necessidade que a empresa est� enfrentando.

Refer�ncias:

http://www.jornaltemporeal.com/2010/06/10/o-crescimento-da-internet-o-avanco-da-tecnologia-pelo-mundo/
http://nosql-database.org/
http://uniredes.org/kb/?View=entry&EntryID=224
http://www.ime.usp.br/~andrers/aulas/bd2005-1/aula11.html
http://www.dicasparacomputador.com/pesquisa-revela-que-empresas-tem-dificuldade-administrar-grandes-volumes-dados.
http://www.infoq.com/br/news/2011/08/facebook-maior-migracao.
http://escalabilidade.com/2010/03/08/introducao-ao-nosql-parte-i/.
http://blog.caelum.com.br/bancos-de-dados-nao-relacionais-e-o-movimento-nosql/
F. Chang , J. Dean , S. Ghemawat , W. C. Hsieh , D. A. Wallach , M. Burrows , T. Chandra , A. Fikes , R. E. Gruber, �Bigtable: A distributed storage system for structured data�, In Proceedings of the 7th Conference on Usenix Symposium on Operating Systems Design And Implementation, Volume 7, 2006.
Lakshman, P. Malik, �Cassandra - A Decentralized Structured Storage System�, LADIS 2009.
http://computerworld.uol.com.br/tecnologia/2010/02/23/crescimento-faz-twitter-trocar-o mysql-pelo-cassandra/.
J. C. Anderson, N. Slater, J. Lehnardt,, �CouchDB: The Definitive Guide�, 1� edi��o, O'Reilly Media, 2009.
http://www.mongodb.org/.
http://www.igvita.com/2010/03/01/schema-free-mysql-vs-nosql/.
http://dbpedias.com/wiki/NoSQL:Consistency_Models_in_Non-Relational_Databases.
http://ccsl.ime.usp.br/wiki/images/2/20/NoSQL_Vantagens_Desvantagens_e_Compromissos.pdf.
http://www.nosqldatabases.com/main/tag/consistent-hashing.
http://dbpedias.com/wiki/NoSQL:Consistency_Models_in_Non-Relational_Databases.
https://www.ibm.com/developerworks/mydeveloperworks/blogs/fd26864d-cb41-49cf-b719-d89c6b072893/entry/escolhendo_a_ferramenta_certa_para_o_banco_de_dados_nosql1?lang=en.
http://www.allthingsdistributed.com/2007/10/amazons_dynamo.html.
http://nosqlba.com.br/.
http://idgnow.uol.com.br/internet/2009/02/19/twitter-e-o-servico-social-mais-instavel durante-2008-aponta-estudo/.
http://www.ffb.edu.br/sites/default/files/tcc-20102-gleidson-sobreira-leite.pdf .
W. Vogels, �Eventually Consistent�, Scalable Web Services, Volume 6 No. 6, Outubro de 2008.

Links �teis

Saiba mais sobre SQL ;)

Conceitos e cria��o de views no SQL Server: Veja neste artigo como trabalhar com views no SQL Server, aprendendo como utilizar os comandos CREATE, ALTER e DROP VIEW.
Curso de SQL: A linguagem SQL � amplamente utilizada em diversos tipos de aplica��es que utilizem bancos de dados relacionais. Neste curso conheceremos os primeiros comandos da linguagem SQL (Structured Query Language), utilizada na estrutura��o e consulta de bancos de dados relacionais como MySQL e SQL Server.
Documenta��o: SQL: Cl�usula Where: Nesta documenta��o voc� aprender� a utilizar o comando WHERE para adicionar filtros �s suas consultas SQL.

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Mar�lia Em 2012

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Willas Mar

N�vel

Muito Bom!

há +1 ano

Douglas

N�vel 0

há +1 ano

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Banco de dados NoSQL: Um novo paradigma - Revista SQL Magazine 102

Este artigo tem o objetivo de explicar as principais caracter�sticas dos bancos de dados NoSQL.