NoSQL: Guia R�pido para Iniciantes em Bancos de Dados

Entendendo o conceito do NoSQL

Neste artigo, veremos o que � o conceito NoSQL, porque ele � geralmente associado ao Big data e quais s�o algumas das v�rias op��es de banco de dados NoSQL existentes atualmente.

Curso relacionado: O que � NoSQL?

O que � NoSQL?

Vamos come�ar sobre o NoSQL, o que vem a ser esse conceito ?

Pesquisando pela net, encontramos muitas defini��es, algumas bem confusas que passam a ideia de um conceito que tenta acabar com o padr�o SQL, bem como encontramos tamb�m defini��es mais realistas, que passam a ideia de um padr�o de armazenamento de dados alternativo ao SQL, oferecendo uma robustez e escalabilidade melhores.

Saiba mais Guia de NoSQL e MongoDB

Para sabermos mais claramente o que � o NoSQL, e qual seu uso, � interessante saber algumas coisas antes.

O termo NoSQL foi primeiramente utilizado em 1998 como o nome de um banco de dados n�o relacional de c�digo aberto.

Seu autor, Carlo Strozzi, alega que o movimento NoSQL "� completamente distinto do modelo relacional e portanto deveria ser mais apropriadamente chamado "NoREL" ou algo que produzisse o mesmo efeito".

Com a crescente populariza��o da internet, diversos novos dados foram surgindo e trat�-los foi se tornando gradualmente mais complexo e sua manuten��o cada vez mais cara.

Em 2006, o artigo: BigTable: A Distributed Storage System for Structured Data, publicado pelo Google em 2006, traz novamente � tona o conceito NoSQL.

No inicio de 2009, o termo NoSQL � reintroduzido por um funcion�rio do Rackspace, Eric Evans, quando Johan Oskarson da Last.fm queria organizar um evento para discutir bancos de dados open source distribu�dos.

O nome era uma tentativa de descrever o surgimento de um n�mero crescente de bancos de dados n�o relacionais e fazia uma refer�ncia ao esquema de atribui��o de nomes dos bancos de dados relacionais mais populares do mercado como MySQL, MS SQL, PostgreSQL, etc.

A partir de ent�o, os bancos de dados n�o relacionais passaram a ser conhecidos como NoSQL, e com crescente populariza��o das redes sociais, a gera��o de conte�do por dispositivos m�veis bem como o n�mero cada vez maior de pessoas e dispositivos conectados, faz com que o trabalho de armazenamento de dados com o objetivo de utiliz�-los em ferramentas anal�ticas, comece a esbarrar nas quest�es de escalabilidade e custos de manuten��o desses dados.

Bancos de dados relacionais escalam, mas quanto maior o tamanho, mais custoso se torna essa escalabilidade, seja pelo custo de novas m�quinas, seja pelo aumento de especialistas nos bancos de dados utilizados.

J� os n�o relacionais, permitem uma escalabilidade mais barata e menos trabalhosa, pois n�o exigem m�quinas extremamente poderosas e sua facilidade de manuten��o permite que um n�mero menor de profissionais seja necess�rio.

Assim, os bancos de dados NoSQL, v�o ficando mais populares entre as grandes empresas pois re�nem as caracter�sticas de poder trabalhar com dados semi-estruturados ou crus vindos de diversas origens (arquivos de log, web-sites, arquivos multim�dia, etc...).

Podemos listar algumas dessas caracter�sticas abaixo:

Utiliza��o do processamento paralelo para processamento das informa��es: para se atingir uma performance razo�vel no processamento de grandes volumes de dados, � mais eficiente dividir a tarefa em v�rias outras menores e que podem assim, serem executadas ao mesmo tempo, distribuindo essas tarefas pelos v�rios processadores dispon�veis, para isso, os sistemas precisam atingir um alto grau de maturidade no processamento paralelo.

O uso de muitos processadores baratos, n�o s� oferece melhor performance, mas se torna tamb�m uma solu��o economicamente interessante, pois dessa forma � poss�vel escalar o sistema horizontalmente apenas adicionando hardware e n�o limita a empresa a poucos fornecedores de hardware mais poderoso.

Distribui��o em escala global: para atender seus usu�rios de forma eficiente, algumas empresas utilizam v�rios data centers, localizados em diversas partes do pais ou do mundo.

Com isso, uma s�rie de quest�es sobre disponibilidade e performance s�o levantadas ao construir os sistemas.

A distribui��o deles combinada com o hardware barato, imp�e ao sistema a necessidade de ser robusto o suficiente para tolerar falhas constantes e imprevis�veis, seja de hardware, seja da infraestrutura do lugar onde o data center se encontra.

Pensando nessas quest�es, bem como nas necessidades internas ou dos clientes, foi surgindo uma grande quantidade de bancos de dados n�o relacionais de trabalham de diferentes maneiras, e as principais est�o listadas abaixo.

Banco de dados que trabalham no esquema chave/valor (Key/Value): sistemas distribu�dos nessa categoria, tamb�m conhecidos como tabelas de hash distribu�das, armazenam objetos indexados por chaves, e possibilitam a busca por esses objetos a partir de suas chaves.

Alguns bancos que utilizam esse padr�o s�o: DynamoDb, Couchbase, Riak, Azure Table Storage, Redis, Tokyo Cabinet, Berkeley DB, etc...

Bancos de dados orientados a documentos: os documentos dos bancos dessa categoria, s�o cole��es de atributos e valores, onde um atributo pode ser multi-valorado. Em geral, os bancos de dados orientados a documento n�o possuem esquema, ou seja, os documentos armazenados n�o precisam possuir estrutura em comum.

Essa caracter�stica faz deles boas op��es para o armazenamento de dados semi estruturados.

Alguns bancos que utilizam esse padr�o s�o: MongoDb, CouchDB, RavenDb, etc.

Bancos de dados de fam�lias de colunas : Bancos relacionais normalmente guardam os registros das tabelas contiguamente no disco. Por exemplo, caso se queira guardar id, nome e endere�o de usu�rios em um sistema de cadastro, os registros seriam: Id1, Nome1, Endere�o1; Id2, Nome2, Endere�o2.

Essa estrutura torna a escrita muito r�pida, pois todos os dados de um registro s�o colocados no disco com uma �nica escrita no banco. Essa estrutura tamb�m � eficiente caso se queira ler registros inteiros. Mas para situa��es onde se quer ler algumas poucas colunas de muitos registros, essa estrutura � pouco eficiente, pois muitos blocos do disco ter�o de ser lidos. Para esses casos onde se quer otimizar a leitura de dados estruturados, bancos de dados de fam�lias de colunas s�o mais interessantes, pois eles guardam os dados contiguamente por coluna.

O exemplo anterior em um banco de dados dessa categoria ficaria: Id1, Id2; Nome1, Nome2; Endere�o1, Endere�o2.

Por esse exemplo � poss�vel perceber a desvantagem de um banco de dados de fam�lias de colunas: a escrita de um novo registro � bem mais custosa do que em um banco de dados tradicional. Assim, num primeiro momento, os bancos tradicionais s�o mais adequados aprocessamento de transa��es online (OLTP) enquanto os bancos de dados de fam�lias de

colunas s�o mais interessantes para processamento anal�tico online (OLAP). O Bigtable � uma implementa��o da Google dessa categoria de bancos de dados . Outros bancos de dados que s�o orientados a coluna: Hadoop, Cassanda, Hypertable, Amazon SimpleDB, etc. Bancos de dados de grafos: diferentemente de outros tipos de bancos de dados NoSQL, esse est� diretamente relacionado a um modelo de dados estabelecido, o modelo de grafos. A ideia desse modelo � representar os dados e / ou o esquema dos dados como grafos dirigidos, ou como estruturas que generalizem a no��o de grafos .

O modelo de grafos � mais interessante que outros quando �informa��es sobre a inter-conectividade ou a topologia dos dados s�o mais importantes, ou t�o importante quantos os dados propriamente ditos . O modelo orientado a grafos possui tr�s componentes b�sicos: os n�s (s�o os v�rtices do grafo), os relacionamentos (s�o as arestas) e as propriedades (ou atributos) dos n�s e relacionamentos.

Neste caso, o banco de dados pode ser visto como um multigrafo rotulado e direcionado, onde cada par de n�s pode ser conectado por mais de uma aresta. Um exemplo pode ser : �Quais cidades foram visitadas anteriormente (seja residindo ou viajando) por pessoas que viajaram para o Rio de Janeiro ?� No modelo relacional esta consulta poderia ser muito complexa devido a necessidade de m�ltiplas jun��es, o que poderia acarretar uma diminui��o no desempenho da aplica��o. Por�m, por meio dos relacionamentos inerentes aos grafos, estas consultas tornam-se mais simples e diretas.

Alguns bancos que utilizam esse padr�o s�o: Neo4J, Infinite Graph, InforGrid, HyperGraphDB, etc. Como podem ver, os bancos de dados que se utilizam do conceito NoSQL, abrangem uma ampla gama de possibilidades de armazenamento da informa��o. Veremos no pr�ximo artigo porque ele tem sido considerado fundamental para o BigData, e como podemos tirar partido de seu potencial.

Comparativo entre modelos NoSQL e Relacionais (SQL)

Durante d�cadas, os bancos relacionais (SQL) dominaram o mercado. Com o avan�o da computa��o distribu�da, Big Data e aplica��es em tempo real, surgiu a necessidade de modelos mais flex�veis, levando � populariza��o dos bancos NoSQL.

A escolha entre bancos de dados relacionais (SQL) e n�o relacionais (NoSQL) se tornou uma decis�o estrat�gica. Cada modelo oferece vantagens, e entender suas caracter�sticas � essencial para escolher a tecnologia certa para cada projeto.

Vantagens de bancos SQL

Forte integridade referencial e transacional
Ferramentas maduras de administra��o
Boa padroniza��o e portabilidade

Vantagens de bancos NoSQL

Alta escalabilidade e performance em grandes volumes
Estrutura flex�vel e adapt�vel a dados diversos
Melhor desempenho em leitura/grava��o massiva

Muitas empresas utilizam uma abordagem h�brida, combinando ambos os modelos para tirar proveito do melhor de cada um.

Comparativo de caracter�sticas

Caracter�stica	Banco Relacional (SQL)	Banco NoSQL
Modelo de dados	Tabelas com linhas e colunas (esquema r�gido)	Documentos, grafos, colunas ou chave-valor
Consist�ncia	Alta consist�ncia (ACID)	Consist�ncia eventual (BASE)
Escalabilidade	Vertical (m�quinas mais potentes)	Horizontal (mais m�quinas baratas)
Flexibilidade de esquema	Estrutura fixa e normalizada	Esquema flex�vel e din�mico
Consultas	SQL, com JOINs e normaliza��o	APIs espec�ficas, sem JOINs complexos
Indicado para	Transa��es cr�ticas, sistemas ERP, contabilidade	Big Data, redes sociais, dados semiestruturados

Hoje, muitas arquiteturas modernas utilizam mais de um tipo de banco no mesmo sistema.

Exemplo:

MongoDB para armazenar produtos com atributos vari�veis;
PostgreSQL para transa��es e relat�rios gerenciais.

Conclus�o

A decis�o entre SQL e NoSQL depende da natureza do projeto. Enquanto bancos relacionais s�o s�lidos e confi�veis para transa��es estruturadas, os bancos NoSQL oferecem flexibilidade, performance e escalabilidade em aplica��es modernas e de grande volume.

NoSQL com Intelig�ncia Artificial

A intelig�ncia artificial (IA) exige estruturas de dados flex�veis, escal�veis e r�pidas para armazenar e acessar grandes volumes de dados. Nesse cen�rio, bancos NoSQL se destacam como uma alternativa poderosa para dar suporte a essas aplica��es.

Benef�cios

Volume e variedade de dados
Alta performance de leitura/grava��o
Modelos de dados flex�veis

Exemplos de uso

MongoDB: Armazena datasets de treinamento em formato JSON, �til em sistemas de recomenda��o.
Neo4j: Representa��o de rela��es em grafos para algoritmos de clusteriza��o ou detec��o de fraudes.
Cassandra: Armazenamento de s�ries temporais para modelos preditivos em IoT.

Desafios e boas pr�ticas

Garantir a consist�ncia e qualidade dos dados mesmo em arquiteturas distribu�das
Utilizar ferramentas de versionamento de dados e modelos
Combinar com solu��es de Data Lake para controle de hist�rico

Conclus�o

A combina��o de bancos de dados NoSQL com aplica��es de Intelig�ncia Artificial (IA) tem se mostrado cada vez mais estrat�gica para lidar com a complexidade e o volume dos dados modernos. A flexibilidade dos modelos NoSQL, somada � sua escalabilidade e desempenho em tempo real, permite alimentar pipelines de machine learning com dados diversos e em grande escala, vindos de m�ltiplas fontes e formatos.

Saiba mais sobre SQL ;)

Conceitos e cria��o de views no SQL Server:
Veja neste artigo como trabalhar com views no SQL Server, aprendendo como utilizar os comandos CREATE, ALTER e DROP VIEW.
Curso de SQL:
A linguagem SQL � amplamente utilizada em diversos tipos de aplica��es que utilizem bancos de dados relacionais. Neste curso conheceremos os primeiros comandos da linguagem SQL (Structured Query Language), utilizada na estrutura��o e consulta de bancos de dados relacionais como MySQL e SQL Server.
Documenta��o: SQL: Cl�usula Where:
Nesta documenta��o voc� aprender� a utilizar o comando WHERE para adicionar filtros �s suas consultas SQL.

Confira outros conte�dos:

Por Vinicius Em 2012

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Rodolfo Gomes

DevMedia

O NoSQL é poderoso, muito bom!

há +1 ano

Daniel Amaral

Parab�ns pelo artigo, me ajudou bastante!

há +1 ano

Vinicius Ianni

Fico contente que tenha lhe ajudado de alguma forma.

Obrigado :)

há +1 ano

Diego Melo

Muito Esclarecedor o artigo. Parabens.

há +1 ano

Introdu��o aos bancos de dados NoSQL

Veja neste artigo o que � o conceito NoSQL, porque ele � geralmente associado ao Big data e quais s�o as v�rias op��es de banco de dados NoSQL existentes atualmente.

Entendendo o conceito do NoSQL

O que � NoSQL?

Comparativo entre modelos NoSQL e Relacionais (SQL)

Vantagens de bancos SQL

Vantagens de bancos NoSQL

Comparativo de caracter�sticas

Exemplo:

Conclus�o

NoSQL com Intelig�ncia Artificial

Benef�cios

Exemplos de uso

Desafios e boas pr�ticas

Conclus�o

Saiba mais sobre SQL ;)

Confira outros conte�dos: