Artigo Invista em voc�! Saiba como a DevMedia pode ajudar sua carreira.

Naive Bayes: Minera��o de dados na pr�tica - Revista SQL Magazine 110

Este artigo apresenta aspectos te�ricos e pr�ticos sobre a t�cnica de minera��o de classificadores conhecida como Na�ve Bayes. A partir de um pequeno exemplo, s�o descritos os passos executados para realizar a constru��o do classificador.

Artigo do tipo Tutorial
Recursos especiais neste artigo:
Cont�m nota Quickupdate, Conte�do sobre boas pr�ticas.

Minera��o de dados na pr�tica
Classifica��o � provavelmente a tarefa de data mining mais conhecida e utilizada. Ela consiste em associar objetos a um conjunto pr�-definido de classes de acordo com as suas caracter�sticas. As aplica��es pr�ticas incluem aprova��o de cr�dito, detec��o de fraudes, diagn�stico m�dico, entre outras. Este artigo apresenta aspectos te�ricos e pr�ticos sobre a t�cnica de minera��o de classificadores conhecida como Na�ve Bayes.

Este artigo aborda a t�cnica de classifica��o Na�ve Bayes e est� dividido em duas partes. A primeira � te�rica. A partir de um pequeno exemplo, s�o descritos os passos executados pelo Na�ve Bayes para realizar a constru��o do classificador e para efetuar a classifica��o de novos objetos. A segunda parte � pr�tica, apresentando as instru��es para utilizar o Na�ve Bayes em projetos reais de minera��o de dados com o uso da Weka API, uma biblioteca open source que possibilita a cria��o de sistemas para minera��o de dados na Linguagem Java.

Em que situa��o o tema �til
Este artigo descreve os princ�pios b�sicos empregados pela t�cnica Na�ve Bayes para a minera��o de classificadores. O artigo enfoca especialmente a utiliza��o desta t�cnica em processos pr�ticos de minera��o de dados com o uso da biblioteca open source Weka (biblioteca Java para minera��o de dados). S�o destacados os seguintes aspectos: minera��o do modelo de classifica��o, classifica��o de novos objetos e interpreta��o dos resultados obtidos.

Minera��o de dados (data mining) � um processo que utiliza algoritmos para analisar grandes bases de dados de modo eficiente procurando extrair das mesmas conhecimento valioso. Uma das mais �teis tarefas de minera��o de dados chama-se classifica��o. Seu objetivo � bastante simples: um programa de computador deve atribuir automaticamente uma classe para um objeto cuja classe seja desconhecida.

Para que o conceito de classifica��o fique claro, abriremos este artigo apresentando alguns exemplos. Como primeiro exemplo, considere um programa que receba como entrada a fotografia do rosto de uma pessoa e que seja capaz de determinar automaticamente se ela � do sexo masculino ou feminino. Veja que o objetivo do programa � associar uma classe (�masculino� ou �feminino�) para um objeto (a fotografia de um rosto), desta forma, trata-se de um programa que realiza a tarefa de classifica��o. Existem diversos outros exemplos de aplica��es pr�ticas mais interessantes e importantes em �reas distintas como seguran�a de informa��es, finan�as, com�rcio, marketing, bioinform�tica e outras. Alguns s�o relacionados a seguir:

Detec��o de fraudes: identificar se uma transa��o financeira � �legal� ou �suspeita�.
Programas de filtragem de spam: detectar se e-mail � �normal� ou �spam�.
Aprova��o de cr�dito: classificar um cliente como de �alto�, �m�dio� ou �baixo� risco para a concess�o de cr�dito.
Atribui��o de t�picos (Topic Tagging): textos livres (ex: texto de uma not�cia), podem ser automaticamente classificados em um n�mero fixo de categorias (ex: �esporte�, �pol�tica�, �cultura�).
Na �rea de bioinform�tica, os algoritmos de classifica��o possuem diversas aplica��es como, por exemplo, a identifica��o da classe de prote�nas, o que possibilita descobrir quais s�o as fun��es das mesmas.

Um programa ou algoritmo criado com o intuito de executar a tarefa de classifica��o � denominado classificador. Nos dias atuais, a constru��o de classificadores precisos e eficientes � considerada um dos grandes desafios na �rea de minera��o de dados tendo em vista o grande n�mero de aplica��es importantes para a tarefa. Por este motivo, foram desenvolvidas diversas t�cnicas (algoritmos) para a constru��o de classificadores, tais como, �rvores de decis�o, redes neurais, SVMs (Support Vector Machines), k-NN (k-Nearest Neighbors) e Na�ve Bayes.

Este artigo aborda o algoritmo Na�ve Bayes, um dos mais simples, populares e eficientes para classifica��o. Uma caracter�stica atraente desse classificador � a sua capacidade de produzir estimativas de probabilidade ao inv�s de simples classifica��es. Isto significa que, para cada r�tulo de classe, o classificador pode gerar uma estimativa de o novo objeto pertencer � mesma.

A seguir apresenta-se um exemplo. Considere uma institui��o financeira que utilize um software de minera��o de dados que empregue o classificador Na�ve Bayes para identificar se os seus potencias clientes apresentam risco �baixo�, �m�dio� ou �alto� para a concess�o de um financiamento imobili�rio. Suponha que dois novos clientes � Antonio e Juan � ser�o submetidos ao processo de classifica��o. Nesta situa��o, o classificador poderia gerar um relat�rio com formato similar ao mostrado na Listagem 1. Observe que cada objeto � listado juntamente com as estimativas de probabilidade associadas a cada um dos r�tulos de classe poss�veis (�baixo�, �m�dio� ou �alto�). A maioria das ferramentas comerciais de minera��o de dados � como as embutidas nos SGBDs Oracle e SQL Server - � capaz de gerar relat�rios similares para os usu�rios.

Listagem 1. Estimativas de Probabilidade produzidas pelo classificador Na�ve Bayes


  
 Cliente: Antonio  
     Risco = �baixo� 85%
     Risco = �m�dio� 10%
     Risco = �alto�   5%
  
 Cliente: Juan  
     Risco = �baixo� 12%
     Risco = �m�dio� 38%
     Risco = �alto�  50%

Este artigo est� dividido em duas partes principais. A primeira cont�m um breve resumo dos principais conceitos relacionados ao algoritmo Na�ve Bayes. A ideia � apresentar o conte�do de teoria suficientemente necess�rio para habilitar o leitor a entender o funcionamento b�sico da t�cnica. Por sua vez, a segunda parte do artigo possui um enfoque bem mais pr�tico. Ela tem como principal objetivo demonstrar a utiliza��o do Na�ve Bayes em um sistema de minera��o de dados. Para elaborar este sistema, faremos uso da Weka API, um software/biblioteca open-source para minera��o de dados cujas principais caracter�sticas foram apresentadas em um artigo da edi��o 107 da SQL Magazine. Com isto, espera-se demonstrar a �receita b�sica� para utiliza��o do Na�ve Bayes em projetos pr�ticos de minera��o de dados.

Entendendo o classificador Na�ve Bayes

Esta se��o explica o funcionamento do algoritmo Na�ve Bayes a partir da descri��o dos passos que ele emprega para realizar a tarefa de classifica��o. Com o intuito de tornar o texto mais �leve� e did�tico, os conceitos ser�o introduzidos atrav�s de exemplos baseados no processo de classifica��o de uma pequena base de dados contendo informa��es sobre as vendas de uma loja de departamentos hipot�tica. A subse��o a seguir apresenta esta base de dados exemplo e oferece informa��es gerais sobre as caracter�sticas das bases de dados utilizadas em processos de classifica��o.

Bases de dados para classifica��o

Conforme introduzido no in�cio do artigo, a tarefa de classifica��o possui como objetivo associar objetos de classe desconhecida a um conjunto pr�-definido de classes. Os algoritmos de classifica��o extraem os modelos classificadores a partir de base de dados em que cada registro tenha o formato (x,y):

...

Quer ler esse conteúdo completo? Tenha acesso completo

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Eduardo Em 2013

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso