Quer ter acesso a todos os cursos desse Guia?
Big Data com Java
Neste Guia de Consulta você encontrará todo o conteúdo que precisa para entender a que se refere o termo Big Data, bem como sua importância, da perspectiva de um programador Java.
Introdução
Em um cenário com sistemas super conectados, aplicações mobile, internet das coisas e imensos volumes de dados, Big Data é tido por muitos como o ponto de interseção que faltava. Com essa relevância, o uso de Big Data é cada vez mais comum em nosso dia a dia e já se faz presente em sistemas de empresas que enxergam em seus dados informações suficientes para a tomada de melhores decisões. Portanto, saia na frente: além de dominar as definições, veja neste guia como trabalhar com soluções Java para Big Data na prática.
Hadoop
Hadoop é uma plataforma distribuída para processamento de dados. Nele encontraremos diversas ferramentas que permitem gerenciar grandes volumes de informação, bem como extraí-las de diferentes fontes, como arquivos e streams.
MapReduce
A plataforma Hadoop utiliza o modelo conhecido como MapReduce para extrair grandes volumes de dados de diferentes fontes. Nele, o processamento é dividido em duas partes, sendo a primeira responsável por filtrar ordenadamente os dados e a segunda sumarizar e avaliar esses dados. Caso você queira se aprofundar em Big Data, recomendamos conhecer esta ferramenta:
Elasticsearch
Apache Lucene é um motor de busca textual de código aberto, conhecido por ter alta performance e ideal para aplicações que necessitam de full-text search. Procurando torná-la escalável, o projeto Elasticsearch reescreveu boa parte de seu código, tornando a ferramenta ainda mais adequada a aplicações web. Hoje, nomes famosos como GitHub e Deezer estão entre seus usuários. Aprenda sobre ela nos artigos:
-
ArtigoElasticsearch Hadoop: busca elástica com processamento poderoso
-
ArtigoElasticsearch: realizando buscas no Big Data
-
ArtigoDados Abertos no Elasticsearch: uma aplicação prática com Logstash e Kibana
-
ArtigoOpen Data: desenvolvendo uma aplicação para monitoramento de ônibus
-
ArtigoElasticsearch: Analisando Logs
-
ArtigoElasticsearch: Como gerenciar logs com Logstash
Apache Spark
Spark é um motor de processamento compatível com Hadoop, destinado ao processamento de rotinas em lotes, computação de streamings, bem como Machine Learning. Entenda como extrair o melhor dessa ferramenta nos artigos:
-
ArtigoIntrodução ao Apache Spark
-
ArtigoProcessamento de dados em Java com Apache Spark
-
ArtigoApache Spark: Processando grafos com Big Data
-
ArtigoApache Spark: Como criar um mecanismo de sugestão de produtos
-
ArtigoApache Spark: Trabalhando com SQL em aplicações Big Data
-
ArtigoStorm vs. Spark: uma introdução à Fast Data
Outras soluções da Apache
Nesta seção reunimos outros conteúdos sobre ferramentas relacionadas a Big Data para você continuar seus estudos. Saiba mais:
Na prática
Agora que você já está por dentro do Big Data, continue estudando com os vídeos abaixo, que apresentam outros tópicos práticos sobre esse tema.
Mais sobre Java
Além dos cursos e exemplos sugeridos nesse guia, a DevMedia publica com frequência novos conteúdos sobre Java, os quais você pode conferir nos Guias de Consulta abaixo:
-
Guia de CarreiraProgramador Java Guia
-
Guia de consultaLinguagem Java Guia
-
Guia de consultaHibernate Guia
-
Guia de consultaJSF - JavaServer Faces Guia
-
Guia de consultaSpring Framework Guia
-
Guia de consultaJava Enterprise Edition - Java EE Guia
-
Guia de consultaREST e Java Guia
-
Guia de consultaPadrões de Projeto em Java Guia
-
Guia de consultaTestes e DevOps Guia
Além disso, você pode conferir todo o conteúdo de Java clicando aqui.
Perguntas frequentes