Conhe�a a gera��o de banco de dados NoSQL e NewSQL

Hoje as informa��es s�o vitais para as organiza��es, que possuem v�rias fontes de dados e sistemas para armazen�-los. Por�m, com a utiliza��o de bancos de dados relacionais e a normaliza��o, que tem como princ�pio a consist�ncia dos dados, h� um grande problema que retarda a grava��o e recupera��o, pois a cada dia que passa o n�mero de dados inseridos nesses bancos � cada vez maior, deixando a an�lise dos dados cada vez pior.

Com a evolu��o da Web 2.0, a prolifera��o das redes sociais e a intensa intera��o com os usu�rios, a cada dia mais e mais dados s�o inseridos e, recuper�-los para an�lise em alta velocidade � quase imposs�vel, j� que os mesmos n�o d�o esse suporte. Por isso, o NoSQL foi projetado especialmente para arquiteturas distribu�das e com os conceitos da n�o normaliza��o e a n�o utiliza��o de uma uma linguagem de consulta, como o SQL. Mas com a sua utiliza��o desenfreada alguns problemas foram enfrentados, tais como falta do uso de transa��es, a falta das consultas SQL e a estrutura complexa por falta de uma boa modelagem. Isso deu abertura a nova proposta: o NewSQL. Esse foi projetado para estender os benef�cios do modelo relacional para arquiteturas distribu�das e melhorar o desempenho dos bancos de dados SQL, n�o sendo mais necess�rio aumentar a capacidade dos servidores, fazendo o uso da escalabilidade horizontal. Nesse artigo ser�o apresentadas as principais caracter�sticas dos bancos de dados NoSQL e NewSQL e o uso no atual cen�rio.

NoSQL

As principais caracter�sticas dos bancos de dados NoSQL � a escalabilidade horizontal baseada em uma arquitetura do tipo mem�ria distribu�da com replica��o e fragmenta��o dos dados em diferentes servidores (CATTELL, 2010), permitindo suportar um grande n�mero de opera��es de I/O (Input /Output) por segundo. A maioria desses bancos n�o fornecem suporte �s propriedades transacionais ACID para conseguirem um desempenho e uma escalabilidade maior. Os SGBD NoSQL operam sobre a rela��o desempenho e complexidade do modelo, tendendo sempre a aumentar a primeira. CATTELL (2010) defini seis das caracter�sticas mais importantes dos bancos de dados NoSQL:

Aumento de desempenho de opera��es simples quando do aumento do n�mero de n�s;
Replica��o e distribui��o de dados em diferentes n�s;
No lugar do SQL, um protocolo simples de comunica��o com o SGBD;
Um modelo de controle de concorr�ncia mais �relaxado� do que os utilizados nos SGBDR tradicionais, chamados consist�ncia tardia;
Uma distribui��o eficiente dos �ndices e utiliza��o de mem�ria RAM para armazenamento de dados;
Adi��o din�mica de atributos aos registros j� existentes na base (pela n�o-obriga��o de ter esquemas fixos).

Os bancos de dados NoSQL chegaram ao mercado como uma alternativa para atender �s necessidades das aplica��es que os SGBD tradicionais tinham dificuldade em suprir, devido aos problemas de escalabilidade e disponibilidade. No entanto, estas solu��es j� enfrentam alguns problemas (LEAVITT, 2010), pois n�o possuem uma linguagem unificada de consulta, como o SQL, e necessitam de uma programa��o manual das consultas, o que pode n�o ser uma tarefa vi�vel para aqueles que n�o sabem codificar essas solu��es. Al�m disso, ao longo dos anos foi investido muito em algoritmos e formas de aprimorar compiladores SQL para gerar planos de execu��o de consultas otimizadas, assim, ao desenvolver novos m�todos de acesso, perde-se esta experi�ncia. E como o NoSQL d� suporte apenas a consist�ncia tardia de dados para aplica��es cuja exatid�o dos dados � cr�tica, n�o ter garantias de consist�ncia pode ser um grande problema. Os bancos de dados NoSQL podem ser classificados em diferentes tipos, de acordo com o uso apropriado do banco para uma determinada tarefa. Eles podem ser classificados como:

Pares Chave-Valor: Sistema que armazena valores indexados para posterior recupera��o atrav�s de chaves;
Orientados � Coluna: Diferentemente dos SGBD que armazenam as informa��es em tabelas fortemente estruturadas em linhas e colunas, esse tipo de sistema cont�m uma tabela extens�vel de dados minimamente relacionados. Cada linha desta tabela pode possuir um conjunto pr�prio de colunas, que n�o precisa ser igual aos das demais. A escalabilidade � feita atrav�s da distribui��o das linhas e colunas pelos n�s, fragmentando inicialmente as colunas de uma tabela e depois fragmentando as linhas dessas tabelas resultantes pela chave prim�ria, com fragmenta��o por intervalo;
Bancos de dados de grafos: Est�o diretamente relacionados a modelos de dados a grafos, tendo como ideia representar os dados como estruturas que generalizem a no��o de grafos. Este modelo � proposto para quando a topologia dos dados � mais importante;
Orientados a documentos: Segundo Anderson (2009), esses bancos de dados utilizam o conceito de dados e documentos autocontidos e autodescritivos. Isso implica que o documento em si j� define como ele deve ser apresentado e sua estrutura define como devem ser armazenados.

NewSQL

Os bancos de dados NewSQL buscam promover a mesma melhoria de desempenho e escalabilidade dos sistemas NoSQL, n�o abrindo m�o dos benef�cios dos bancos de dados tradicionais, da linguagem SQL e das propriedades ACID. Mike Stonebreaker, fundador do VoltDB (um dos bancos de dados desse novo modelo), destacou a vantagem dos bancos de dados NewSQL por proporcionarem consultas em tempo real, al�m de maior capacidade de processamento. Segundo Mike, h� um custo grande em n�o usar SQL, sendo exigido trabalho excessivo dos desenvolvedores para compensar sua aus�ncia.

Diferente dos SGBD tradicionais, que eram considerados solu��es para qualquer tipo de aplica��o, os NewSQL utilizam uma estrat�gia diferente, onde cada novo sistema desenvolvido visa atender a uma necessidade espec�fica do mercado e busca alcan��-lo de forma separada, terminando com o antigo conceito de ter um �nico sistema que sirva para qualquer tipo de aplica��o, fazendo com que os bancos de dados sejam especialistas para um prop�sito, n�o gerando mais um n�mero absurdo de fun��es e comportamentos desnecess�rios para uma determinada aplica��o. STONEBRAKER e CATTEL (2011) definem cinco caracter�sticas de um SGBD NewSQL:

Linguagem SQL como meio de intera��o entre o SGBD e a aplica��o;
Suporte para transa��es ACID;
Controle de concorr�ncia n�o bloqueante, para que as leituras e escritas n�o causem conflitos entre si;
Arquitetura que forne�a um maior desempenho por n� de processamento;
Arquitetura escal�vel, com mem�ria distribu�da e com capacidade de funcionar em um aglomerado com um grande n�mero de n�s.

Na Tabela 1 temos um comparativo das caracter�sticas dos bancos de dados relacionais (RDBMS), NoSQL, e NewSQL, com suas capacidades e pontos fortes.

Caracter�stica	RDBMS	NoSQL	NewSQL
Cumprimento ACID (dados, integridade de transa��es)	Sim	N�o	Sim
OLAP / OLTP	Sim	N�o	Sim
A an�lise dos dados (agregados, transformar, etc.)	Sim	N�o	Sim
Rigidez do esquema (mapeamento rigoroso da modelo)	Sim	N�o	Talvez
Flexibilidade formato de dados	N�o	Sim	Talvez
A computa��o distribu�da	Sim	Sim	Sim
Escala para cima (vertical) / Dimensionar (horizontal)	Sim	Sim	Sim
Desempenho com crescimento de dados	R�pido	R�pido	Muito R�pido
Sobrecarga de desempenho	Enorme	Moderado	M�nimo
Popularidade / Suporte comunidade	Enorme	Crescente	Crescendo lentamente

Tabela 1. Comparativo entre RDBMS, NoSQL e NewSQL

A partir dessa tabela podemos observar que o NewSQL � um aprimoramento do RDBMS utilizando o melhor dos dois mundos. Ele manteve totalmente as caracter�sticas dos bancos de dados padr�es, implementando as inova��es do NoSQL. Nos itens em que se encontram "Talvez" � porque depende do Banco NewSQL que estamos utilizando, pois como vimos, cada banco tem um prop�sito espec�fico. Existem alguns bancos NoSQL especialistas com o poder do NewSQL, como � o caso do MariaDB (Desenvolvido pelo criador do MySQL).

Big Data e sua rela��o com os bancos de dados NoSQL e NewSQL

As aplica��es Big Data originaram-se com a chegada da Web 2.0, evoluindo com grande velocidade, e tem como proposta dar ao usu�rio informa��es �teis de forma r�pida ou permitindo que a empresa tome boas decis�es no n�vel de neg�cios.

Com a utiliza��o dessas aplica��es por gigantes da internet, como Google, Facebook e Youtube, tornou ainda mais popular o conceito de BigData, sendo considerada pela equipe da Gartner umas das tecnologias que ter�o maior import�ncia na moderniza��o da gest�o da informa��o com fortes impactos na infraestrutura da informa��o e governan�a das empresas. Segundo a Gartner, o Big Data suporta solu��es de processamento para uma variedade de dados novos e j� existentes, trazendo benef�cios reais para os neg�cios. Ainda assim, o processamento do volume e variedade de dados continuam sendo solu��es t�cnicas, a menos que sejam parte das metas de neg�cio.

O aspecto essencial do Big Data n�o � a habilidade t�cnica de processamento de dados, mas os benef�cios que podem ser alcan�ados por uma organiza��o utilizando suas an�lises.

O problema que os dados hoje s�o gerados de v�rias maneiras, gerando uma grande massa de dados para an�lise, dando origem ao problema com os bancos de dados relacionais pela n�o capacidade de processar tanta informa��o com alta disponibilidade, otimiza��o e escalabilidade. Com isso, a necessidade de sistemas de bancos de dados mais eficientes para estas tarefas, motivando a utiliza��o dos bancos de dados NoSQL e NewSQL.

A velocidade da disponibiliza��o das informa��es � essencial para a tomada de decis�es, j� que uma informa��o tardia n�o tem utilidade, por isso os cinco "Vs" do Big Data (Volume, Velocidade, Variedade, Veracidade e Valor).

A necessidade de sistemas de bancos de dados mais eficientes para estas tarefas motivou a utiliza��o dos bancos de dados NoSQL e NewSQL. Os bancos NoSQL tiveram um crescente aumento com � difus�o dos Big Data, chegando algumas empresas a desenvolverem bancos internos para atender inicialmente demandas da pr�pria empresa, onde acabaram se tornando um produto, como o caso do Big Table e Dynamo, desenvolvidos para solucionar problemas com larga escala que sofriam no momento.

Outra coisa interessante � que os bancos NoSQL e os NewSQL s�o concebidos e evolu�dos como solu��es para os problemas enfrentados pelo Big Data. Como s�o poucas as empresas que sofrem com problemas de larga escala como as gigantes, o que impulsiona de fato as melhorias nos bancos de dados � o uso de solu��es anal�ticas como BI, Data Warehouse, ferramentas de ETL e de cubos.

Alguns bancos de dados NoSQL e NewSQL

NoSQL

Aerospike: Banco de dados NoSQL que oferece uma vantagem de velocidade de mem�ria, atraindo empresas de an�ncios de alta escala e aquelas que precisam de tempos de resposta em milissegundo. Aerospike est� apostando em novas categorias, incluindo jogos, e-commerce e seguran�a, onde a baixa lat�ncia � tudo.
Apache Cassandra: Os pontos fortes s�o a modelagem de dados NoSQL e escalabilidade linear flex�vel em hardware commoditypor conta do uso de cluster.
Amazon DynamoDB: foi desenvolvido pela Amazon para incrementar o seu pr�prio neg�cio e-commerce em r�pido crescimento, tendo seus servi�os altamente escal�veis. Inspirou o Cassandra, Riak, e outros projetos NoSQL no processo.
MongoDB: � o banco de dados mais popular NoSQL, com mais de sete milh�es de downloads e centenas de milhares de implanta��es. Sua popularidade se deve � facilidade de desenvolvimento e manejo flex�vel dos dados. Muito utilizado em aplica��es de redes sociais web e m�vel.
HBase: � o banco de dados que roda em cima do HDFS (Hadoop Distributed File System � sistema de arquivos distribu�do projetado para rodar em hardware commodity), por isso d� aos usu�rios a capacidade �nica de trabalhar diretamente com os dados armazenados no Hadoop. As caracter�sticas incluem grande escalabilidade.

NewSQL

MemSQL: Como o pr�prio nome sugere, � operado em mem�ria, e � um sistema de banco de dados de alta escala por sua combina��o de desempenho e compatibilidade com o SQL transacional e ACID na mem�ria, adicionando uma interface relacional em uma camada de dados in-memory.
VoltDB: Projetado por v�rios pesquisadores de sistema de banco de dados bem conhecidos, esse banco oferece a velocidade e a alta escalabilidade dos bancos de dados NoSQL, mas com garantias ACID, e sua lat�ncia em milissegundo e integra��o com Hadoop.
SQLFire: Servidor de banco de dados NewSQL da VMware, desenvolvido para escalar em plataformas nas nuvens e tomar as vantagens de infraestrutura virtualizadas.
MariaDB: foi desenvolvido pelo criador do MySQL e � totalmente compat�vel com o MySQL. Tamb�m pode interagir com os bancos de dados NoSQL, como Cassandra e LevelDB.

Algumas Compara��es entre bancos

Em um recente Benchmark foi visto que n�o s� a velocidade na recupera��o dos dados � sentida ao utilizar um banco de dados NewSQL ou NoSQL comparado ao um banco de dados tradicional, mas outros fatores como espa�o de armazenamento em disco.

Um Benchmark publicado em blog.altoros.com, mostra um situa��o onde um n�mero maior de registros foi inserido em uma base NewSQL e o espa�o utilizado veio a ser menor que em um sistema tradicional: ao utilizar um banco de dados MySQL com a inser��o de 234.238.440 registros, o espa�o em disco utilizado foi de 210 GB com uma transfer�ncia de aproximadamente 28.000 a 18.000 transa��es por segundo, contra 276.934.863 registros inseridos no TokuDB com um espa�o em disco de apenas 50 GB e uma transfer�ncia de 14.000 transa��es por segundos.

Se formos analisar veremos que o n�mero de opera��es feitas pelo MySQL � maior, mas elas foram caindo com o tempo j� o TokuDB se manteve est�vel, operando por mais de cinco horas contra apenas tr�s do MySQL que, por problemas, derrubou o servidor. Em uma segunda compara��o entre os bancos de dados MemSQL e o PostgreSQL foi visto que a recupera��o de dados � mais r�pida, onde o PostgreSQL demorou 14,312 milissegundos para processar 6.850 consultas contra 6,635 milissegundos por 6.850 consultas do MemSQL. Em uma terceira compara��o entre MySQL e MonetDB em uma estrutura de Data Warehouse com um fator contendo 150.970 registros e tr�s dimens�es, o MySQL demorou 5.647 sec para retornar 42 registros na primeira execu��o antes da montagem do plano, e 1.529 sec em m�dia nas demais execu��es ap�s o plano de acesso. J� o MonoNet recuperou essas mesmas informa��es com 0.341 sec em todas as consultas efetuadas.

Com esse pequeno comparativo podemos observar o qu�o poderoso s�o essas novas gera��es de banco de dados.

O neg�cio tamb�m deve estar modelado para as novas tecnologias, caso contr�rio, n�o tem como a mesma fazer milagre e otimizar uma consulta se a estrutura dos dados n�o funciona. Precisamos conhecer o banco e o seu prop�sito: listamos v�rios bancos e cada qual com uma caracter�stica distinta.

Um exemplo de adapta��o de projeto � o Twitter, onde ap�s o grande aumento do n�mero de dados, trocou seu banco de dados do MySQL para um NoSQL e no final teve que retornar para o MySQL devido ao NoSQL n�o atender suas necessidades.

Referencias

Stonebraker, M. (2010). SQL databases v. NoSQL databases. Communications of the ACM

NoSQL vs. NewSQL: Escolhendo a ferramenta certa}
http://voltdb.com/blog/nosql-vs-newsql-choosing-right-tool

Prestando aten��o no NoSQL e NewSQL Databases
http://www.informationweek.com/big-data/big-data-analytics/16-nosql-newsql-databases-to-watch/d/d-id/1269559

O que � realmente novo no NewSQL
http://nwds.cs.washington.edu/files/nwds/pdf/newsql2013-uw.pdf

M�todo para iniciantes

sem base nenhuma

Mentorias individuais

quando voc� travar

+40 projetos reais

para o seu portf�lio

+5000 exerc�cios

para fixar o conte�do

Suporte IA

que te ensina

No code e automa��es

pra entregar mais r�pido

Veja os resultado dos nossos alunos

Conquistas reais de quem est� aplicando o m�todo

Seja Membro

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Confira outros conte�dos:

Por Gutierry Em 2015

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Marcos Santos

Muito bom.. Parabens

há +1 ano

Ver coment�rios anteriores (2)

Moderacao Devmedia

Fala Marcos, beleza?

Quando precisar estamos aqui, pode contar conosco valeu fera.

Forte abra�o.

há +1 ano

Charles Bezerra

Parab�ns, uma vis�o bem simples e informativa sobre assunto.

há +1 ano

Gutierry Pereira

Obrigado pelo feedback.
Um grande abra�o.

há +1 ano

Conhe�a a gera��o de banco de dados NoSQL e NewSQL

Veja neste artigo o conceito e comparativos dos bancos de dados tradicionais e a nova gera��o com os NoSQL e NewSQL. Ser�o descritos os problemas enfrentados pelos atuais bancos e por que da cria��o dessas novas tecnologias.

NoSQL

NewSQL

Big Data e sua rela��o com os bancos de dados NoSQL e NewSQL

Alguns bancos de dados NoSQL e NewSQL

Algumas Compara��es entre bancos

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para come�ar a atuar como programador?

Por que a programa��o se tornou a profiss�o mais promissora da atualidade?

Quais s�o os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programa��o atrav�s da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem hor�rio para as aulas?

Por que a DevMedia n�o usa videoaulas em sua did�tica?

Preciso de um computador espec�fico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais s�o os planos de assinatura dispon�veis?

Adquirindo o plano, terei acesso a todo o conte�do?

A plataforma tem planos vital�cios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

Como excluir meus dados da plataforma?

Confira outros conte�dos: