Aprenda neste artigo como processar Big Data em tempo real.
ArtigosJavaStorm vs. Spark: uma introdução à Fast Data
Por que eu devo ler este artigo:Esse
artigo é útil para estudantes e profissionais que tenham interesse em conhecer
dois frameworks para Fast Data, conceito derivado de Big Data com enfoque em
soluções cujo tempo de processamento seja crucial.
Um caso de uso comum desta
tecnologia pode ser encontrado nas redes sociais, onde um evento só tem sentido
se pode ser compartilhado (acessado, visualizado, comentado) por vários
usuários logo após sua publicação, ou seja, em tempo real.
Dito isso, ao longo
do texto analisaremos o Storm e o Spark, dois novos frameworks da Apache que já
são empregados por importantes players do mercado de Big Data, como Twitter,
Hortonworks, Groupon e Databricks.
Autores: Luiz Henrique Zambom Santana e Eduardo Felipe Zambom Santana
Muitos analistas apontam que o Big Data não
pode ser visto como a solução para todos os problemas computacionais atuais, mesmo
para os que envolvem dados. Isso porque a análise de dados das aplicações
modernas envolve muitas facetas, como análise de estatísticas, aprendizado de
máquina e soluções em tempo real.
Do ponto de vista do desenvolvimento de
software, o principal fator que permitiu a construção de aplicações Big Data
foi o advento do paradigma de MapReduce.
Esse paradigma, publicado em 2004, foi
desenvolvido pelo Google para seu mecanismo de busca e tem como objetivo
processar grandes quantidades de dados através da execução de Jobs em lote
(tradução do termo em inglês batch), podendo assim computar um incrível
volume de dados com enorme vasão (tradução do termo em inglês throughput).
Durante a última década, o MapReduce revolucionou a TI, principalmente através
do Apache Hadoop, sua implementação mais difundida.
Contudo, ao longo do tempo
descobriu-se que esse paradigma não é suficiente para lidar com aplicações Big
Data nas quais a latência é tão ou mais importante que o throughput.
Para entender a diferença entre esses dois
conceitos, imagine uma aplicação de controle de servidores responsável por
enviar e-mails aos administradores de sistemas em caso de falhas. Nestes casos,
ter uma grande vazão (alcançada, por exemplo, com o uso do Hadoop)
representaria avisar uma quantidade enorme de usuários ao mesmo tempo.
Por
outro lado, uma latência pequena representaria avisar tais usuários em poucos
segundos após a falha ocorrer.
No cenário dessa aplicação, claramente uma
latência pequena é mais importante que uma vazão grande, pois um retardo de
horas não seria interessante mesmo que a quantidade enorme de administradores
seja avisada após a falha ocorrer.
Em vista disso, passou a ser natural o
desenvolvimento de ferramentas que garantam baixa latência no cenário de Big
Data. Ao conceito que engloba estas novas ferramentas foi dado o nome de Fast
Data (dados rápidos, em inglês). Segundo a InfoWorld, representam o próximo
passo na evolução do Big Data, pois podem ser entendidos como uma contraposição
à limitação do Hadoop em prover baixa latência.
Nesse contexto, tempo real pode ser entendido
como um sinônimo de streaming, pois aplicações de Fast Data são
desafiadas a examinar em poucos segundos uma enxurrada de dados recebida de
forma incessante, sendo esse exame fundamental para o modelo de negócio no qual
estão inseridas.
Esse problema vem sendo estudado em paralelo e de diferentes
maneiras pelos grandes players de redes sociais, sendo criados, portanto, distintos
tipos de soluções para streaming como, por exemplo: baseada no modelo publisher/subscriber,
como a proposta pelo LinkedIn; em troca de mensagens, como a adotada pelo
Twitter; e no uso intensivo de agregações, como a projetada pelo Facebook.
Com base nesses conceitos, este artigo
apresentará dois frameworks que propõem soluções para análise em tempo real de
informações Big Data: Apache Storm e Apache Spark. Ainda que possam ser usados
por um grande número de linguagens, Storm e Spark – desenvolvidos
respectivamente em Clojure e Scala, duas linguagens executadas pela JVM – guardam
como semelhança o fato do Java ser comum a ambos.
Por isso, este artigo
apresenta o desenvolvimento de aplicações usando as APIs Java destas
tecnologias com foco principal na criação de uma aplicação de monitoramento em
tempo real de páginas web.
Além desta, outras similaridades
importantes entre estes frameworks são: baseiam-se em clusters e no uso
intensivo de memória principal, e têm a baixa latência como principal requisito
de projeto. Contudo, essa aparente sobreposição é apenas superficial, pois a forma
de implementação e os casos de uso variam bastante de uma ferramenta para outra,
como poderemos constatar nos próximos tópicos.
Apache Storm
O Storm é um framework projetado para ser
escalável, tolerante a falhas, com garantia de resposta e ainda pensado para
prover facilidade de configuração e operação. Esses objetivos de projeto são
atingidos através de quatro abstrações básicas, analisadas a seguir e ilustradas
na Figura 1:
·
Tuple (em português, Tupla): representa
uma mensagem que flui através da arquitetura do Storm. As tuplas carregam
informações que vão sendo computadas, transformadas ou persistidas pelos
componentes dessa arquitetura.
Essas informações podem ser, por exemplo, um
twitter postado pouco tempo antes, um documento recentemente cadastrado ou uma
nova leitura do GPS feita por um sensor;
·
Spout (em português, torneira): são
elementos de código (mais propriamente classes) que estão conectados a uma
fonte de dados para transformar estes dados em tuplas, que por sua vez passam a
ser processadas pelo Storm;
·
Bolt (em português, raio): são classes
responsáveis unicamente por fazer computações (como transformações, cálculos,
filtros, agregações, persistência) sobre as tuplas enviadas pelos spouts ou por
outros bolts;
·
Topologia: define como Spouts e Bolts
são combinados em certa aplicação.
Figura 1. Visão geral de uma topologia do Storm.
As abstrações apresentadas são suficientes
para que possamos projetar e codificar aplicações usando o Storm. Assim, na
sequência apresentaremos como desenvolver uma solução para monitorar um site em
tempo real.
Para isso, imagine que estamos acompanhando a primeira página do
site da Globo.com a fim de que, quando uma notícia for adicionada a essa
página, possamos extrair dela o texto através de um framework como o Jsoup
(vide Links) e indexá-lo em uma ferramenta de busca ...
Recomendamos começar pelo Plano de Estudo Carreira Programador Front-End. Essa área da programação é mais visual e intuitiva, tornando-a ideal para iniciantes. No Front-End, você aprenderá a criar a parte visual dos sites, como layout, cores e interatividade. Depois de dominar o Front-End, você pode avançar para Programador Back-End, onde aprenderá a lidar com a lógica e o funcionamento interno dos sites, e, finalmente, para Programador Mobile, focando no desenvolvimento de aplicativos para smartphones. Nossa metodologia é estruturada de forma progressiva para garantir que você desenvolva confiança e experiência ao criar projetos reais, como sites estáticos e dinâmicos.
Em quanto tempo vou me tornar um programador?
O tempo necessário para se tornar um programador varia de acordo com a dedicação de cada estudante. Com nossa metodologia, que inclui um Plano de Estudo detalhado e suporte contínuo, você pode se tornar um programador de 6 meses a um ano, dependendo do seu ritmo e esforço. Nossa abordagem prática e orientada a projetos ajudará a acelerar seu aprendizado.
Eu preciso de um diploma de faculdade para começar a atuar como programador?
Não. Ser programador é uma excelente oportunidade para quem não possui diploma de faculdade. Muitas empresas contratam baseadas nas habilidades técnicas e experiência prática, não necessariamente em diplomas. Após conquistar uma vaga, você pode optar por complementar sua formação com um diploma.
Por que a programação se tornou a profissão mais promissora da atualidade?
A necessidade de programadores cresceu exponencialmente, especialmente após a pandemia de Covid-19, que forçou muitas empresas a se adaptarem ao digital. Com o crescimento das empresas de tecnologia, a demanda por programadores aumentou. Atualmente, há mais de 200 mil vagas abertas no Brasil devido à falta de profissionais qualificados.
Metodologia
Quais são os principais diferenciais da DevMedia?
Didática e Metodologia
Com mais de 20 anos de experiência, nossa metodologia foca em menos aulas e mais prática. Desenvolvemos dezenas de projetos e exercícios para ajudar você a se tornar um programador completo. Nossos projetos são desafiadores e autênticos, não apenas exercícios repetitivos.
Projetos reais e exercícios
Você desenvolverá diversos projetos práticos em cada carreira (Front-End, Back-End e Mobile), recebendo mentoria e suporte contínuo. A prática é essencial, e oferecemos milhares de exercícios para ajudar você a fixar o conteúdo e melhorar sua posição no ranking.
Suporte ao aluno
Nossa plataforma oferece suporte dedicado com professores experientes, respondendo suas dúvidas em menos de uma hora. Isso garante que você receba a ajuda necessária durante toda a sua jornada de aprendizado.
Gamificação
A DevMedia utiliza gamificação para tornar o aprendizado mais envolvente e motivador. Você acumula pontos e moedas por acertos, que podem ser trocados por produtos e customizações no seu card pessoal. Além disso, o sistema de ranking mensal incentiva a competição amigável e a melhoria contínua.
O que eu irei aprender estudando pela DevMedia?
Ao estudar conosco, você se tornará um programador Full Stack, dominando Front-End, Back-End e Mobile. Utilizamos a linguagem JavaScript, a mais utilizada no mercado, preparando você para criar sistemas webs e aplicativos celulares. Nossa abordagem prática inclui exercícios para fixar o conhecimento e desenvolvimento de projetos reais que te preparam, para o mercado de trabalho.
Quais as vantagens de aprender programação através da linguagem JavaScript?
Ela é Multiplataforma, ela vai te permitir programar para web e para celulares utilizando praticamente a mesma sintaxe.
Elá é Full Stack. Ela te permite criar aplicações Front-end, Back-end e Mobile. Isso acelera muito sua carreira e aumenta suas possibilidades de pegar trabalhos autônomos e conquistar uma vaga no mercado.
Ela é fácil de aprender. Como ela não exige conhecimento inicial em “Orientação a Objetos” ela se torna mais simples com uma curva de aprendizado suave e vai te permitir começar a programar mais rápido do que outras linguagens
A plataforma oferece certificados?
Sim, oferecemos dois tipos de certificados: o certificado de conclusão, que você adquire ao consumir o conteúdo, e o certificado de autoridade, que você obtém ao acertar exercícios. Ambos possuem carga horária, que pode ser utilizada para fins acadêmicos, como atividades complementares na faculdade, e também para comprovações em processos seletivos ou no seu currículo.
A plataforma tem suporte ao aluno, como funciona?
Sim, temos uma equipe de programadores pronta para ajudar com todas as suas dúvidas! Durante o horário comercial, o tempo médio de resposta é de até 10 minutos. E não se preocupe, também oferecemos suporte à noite e nos finais de semana, com um prazo de resposta um pouco maior.
A DevMedia me forma como programador Full Stack?
Sim! Oferecemos uma formação completa, do zero até Full Stack. Nosso foco é na prática, então você vai encontrar muitos exercícios e projetos reais ao longo do curso. Garantimos que você sairá com a autonomia necessária para desenvolver seus próprios projetos com confiança!
Tem horário para as aulas?
Não, não temos horários fixos para as aulas. Todo o nosso conteúdo está disponível para você acessar a qualquer momento, permitindo que você estude conforme sua própria disponibilidade e ritmo. Dessa forma, você pode integrar o aprendizado à sua rotina de maneira mais flexível e eficaz.
Por que a DevMedia não usa videoaulas em sua didática?
Nosso foco principal é formar programadores de verdade. Sabemos que o dia a dia de um programador envolve muita leitura, interpretação e escrita de código. Por isso, nosso conteúdo é desenvolvido para ambientar você nesse processo desde o início, proporcionando mais autonomia e acelerando seu aprendizado.
Na vídeo-aula é o professor que está lendo, interpretando e escrevndo o código para você, isso limita o seu progresso. Ao ler e interagir diretamente com o conteúdo, você exercita sua capacidade de leitura e concentração, além de poder avançar no seu próprio ritmo. Dessa forma, você se torna um programador mais independente e preparado para os desafios reais do mercado.
Preciso de um computador específico para estudar na DevMedia?
Não é necessário nada específico. Qualquer computador com processador atual e memória de 8 GB é suficiente.
Eu consigo estudar pelo celular?
Sim, a DevMedia possui um aplicativo que te permite seguir com seus estudos de qualquer lugar.
A DevMedia tem aplicativo?
Sim, nosso aplicativo está disponível na Play Store e na Apple Store, permitindo que você estude de forma prática e conveniente em qualquer lugar.
Preciso estar na faculdade para acompanhar os estudos na DevMedia?
Não, a faculdade não é necessária. Você não precisa de nenhum conhecimento prévio para iniciar os estudos na nossa plataforma.
Assinatura e Pagamentos
Quais são os planos de assinatura disponíveis?
Oferecemos o plano anual, o valor total é lançado no cartão de crédito, parcelado em 12 vezes, e você precisa dispor do valor total no limite do seu cartão. Você também pode optar por pagar no PIX
Adquirindo o plano, terei acesso a todo o conteúdo?
Sim, ao assinar nossa plataforma, você desbloqueia acesso total a todo o nosso conteúdo, sem precisar comprar nada separadamente.
A plataforma tem planos vitalícios?
Não, nossos planos são anuais, garantindo que você tenha acesso contínuo às atualizações mais recentes e aos novos conteúdos. A tecnologia evolui rapidamente, e um plano vitalício oferece um conteúdo estático que se tornará ultrapassado em pouco tempo. Com nossos planos anuais, você está sempre à frente, aprendendo as novidades e tendências mais atuais no mundo da programação.
A DevMedia tem fidelidade?
Sim, nosso plano tem uma fidelidade de 12 meses, o que garante o tempo ideal para você explorar nosso conteúdo e desenvolver a autonomia necessária para trabalhar com programação.
Como funciona o cancelamento?
Nós garantimos seu direito de cancelamento com reembolso total dentro dos primeiros 7 dias.
Para que você aproveite ao máximo seu investimento, oferecemos suporte personalizado para orientá-lo na utilização da plataforma. Também temos a opção de transferência de titularidade do plano, permitindo que outra pessoa aproveite o restante do seu período de assinatura.
Cadastro
Como excluir meus dados da plataforma?
Para excluir seus dados da plataforma, acesse o link : https://www.devmedia.com.br/fale-conosco/ e abra um protocolo de 'Exclusão de dados'. Nossa equipe processará a solicitação e removerá todas as informações do seu cadastro.
Eu sabia pouquíssimas coisas de programação antes de começar a estudar com
vocês, fui me especializando em várias áreas e ferramentas que tinham na plataforma, e com essa
bagagem consegui um estágio logo no início do meu primeiro
período na faculdade.
Estudo aqui na Dev desde o meio do ano passado!
Nesse período a Dev me ajudou a crescer muito aqui no trampo. Fui o primeiro desenvolvedor contratado pela minha
empresa. Hoje eu lidero um time de desenvolvimento! Minha meta é continuar estudando e praticando para ser um
Full-Stack Dev!
Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a
pena, pois a plataforma é bem intuitiva e muuuuito
didática a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito
obrigado!
Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento
front-end, tinha coisas que eu ainda não tinha visto. A
didática é do jeito que qualquer pessoa consegue aprender. Sério, to apaixonado,
adorando demais.
Adquiri o curso de vocês e logo percebi que são os melhores do Brasil. É
um passo a passo incrível. Só não aprende quem não quer.
Foi o melhor investimento da minha vida!
Foi um dos melhores investimentos que já fiz na vida e tenho aprendido
bastante com a plataforma. Vocês estão fazendo parte da minha jornada nesse mundo da
programação, irei assinar meu contrato como programador
graças a plataforma.
Wanderson Oliveira
Comprei a assinatura tem uma semana,
aprendi mais do que 4 meses estudando outros cursos. Exercícios práticos que não tem
como não aprender, estão de parabéns!
Obrigado DevMedia, nunca presenciei uma plataforma de ensino tão presente na vida acadêmica de
seus alunos, parabéns!
Eduardo Dorneles
Aprendi React na plataforma da DevMedia há cerca de 1 ano e meio... Hoje estou há 1 ano empregado trabalhando 100% com
React!
Adauto Junior
Já fiz alguns cursos na área e nenhum é tão bom quanto o de vocês. Estou aprendendo
muito, muito obrigado por existirem. Estão de parabéns... Espero um dia conseguir um emprego na
área.