Algoritmo apriori no Mysql utilizando procedure

Introdu��o

Nos ultimos anos as tecnologias de informa��o tem sofrido constantes mudancas,as empresas tem encontrado um mercado cada vez mais competitivo e concorrido, diante desse cenario, as empresas tem investido cada vez mais em tecnologia, visto que esse setor tornou-se muito importante e estrategico para as mesmas. Os empresarios necessitam dessas informa��es em tempo habil e integras para tomarem decis�es importantes para o rumo do seu negocio. Mas como apartir de grande volume de dados conseguir informa��es estrat�gicas?? Uma das alternativas � o Data Mining

Objetivo

Implantar o algoritmo apriori para 2 itens , utilizando stored procedures no mysql 5

Algoritmo Apriori

� um algoritmo que utiliza regras de associa��o, ou seja, busca por itens frequentes em banco de dados que ocorrem simultaneamente em transa��es de banco de dados.

Imaginemos a seguinte tabela de vendas no banco de dados onde

Trans: transa��o

Prdno: codigo do produto

Exemplo:

Trans	prdno
1	2
1	4
1	5
2	1
2	3
2	4
2	5
3	2
3	4
3	5
4	1
4	2
4	4
4	5
5	3
6	5
7	4
8	7
9	6
9	7
10	6

Vamos criar uma tabela que ir� guardar os resultados das regras obtidas.

Nome Campo	Tipo de dado	Comentario
X	int not null	guarda codigo do produto
Y	int not null	guarda codigo do produto
Freq_x	float	guarda frequencia de x com relacao ao total de vendas
Freq_xy	float	guarda frequencia x em relacao a y

No cliente do mysql ou no query browser criaremos a tabela com a estrutura descrita acima:

create table regras (
x int not null,
y int not null,
freq_x float,
freq_xy float )

Codigo do algoritmo

Utilizaremos o conceito de stored procedures.(OBS: no caso do mysql a vers�o deve ser 5 ou superior).

Nome procedure: sp_apriori

Parametros de entrada: sup_min (suporte minimo)

conf (confian�a)

No cliente do mysql inserir o codigo da procedure:

DELIMITER $$

DROP PROCEDURE IF EXISTS `betao`.`sp_apriori` $$
CREATE PROCEDURE `sp_apriori`(in sup_min integer,in conf integer)
begin
    delete from regras;
    select @total:=count(distinct trans) as total from vendas;
    /* criacao da tabela temporaria para um item */
    create temporary table 1_item(
    id int not null auto_increment primary key,
    prdno int not null,
    freq float not null);

/* inserindo na tabela temporaria os 1 itens de acordo com o suporte minimo definido no parametro de entrada */

insert into 1_item(prdno,freq) select prdno,ROUND(100*count(prdno)/@total,2) as freq

from vendas

group by prdno

having freq >= sup_min;

select @total_aux:=count(*) from 1_item;
set @i:=1;

     /* nesse while verifico as associacoes dos 1 itens classificados acima */
    while @i <= @total_aux do
      select @cod:=prdno,@freqx:=freq from 1_item where id=@i;
      insert into regras
      select @cod,prdno,@freqx,ROUND(100*count(prdno)/@total,2) as freq
      from vendas where trans in(select trans from vendas where prdno=@cod)
      and prdno <> @cod group by prdno having freq >=sup_min; /*nessa linha filtro os produtos que sairam com o outro produto
      set @i:=@i+1;
    end while;
/* seleciona as regras que estao dentro da confianca passada como parametro, ou seja, deleta aquelas que nao interessam */
    delete from regras where (freq_xy/freq_x) < (conf/100);
end $$

DELIMITER ;

Chamando algoritmo com suporte minimo de 30% e confian�a de 70%

Para chamar o algoritmo no cliente do mysql executar:

Call sp_apriori(30,70);

Resultados obtidos e conclus�o:

O resultado na tabela regra ser�:

X	Y	Freq_x	Freq_xy
2	4	30	30
2	5	30	30
4	5	50	40
5	4	50	40

Conclus�es:

Na tabela acima pode-se concluir os resultados da seguinte forma:

� O produto 2 vende-se 30% do total das vendas sendo que toda vez que vende-se 2 tamb�m vende-se 4 100%(30/30).

� O produto 2 vende-se 30% do total das vendas sendo que toda vez que vende-se 2 tamb�m vende-se 5 100%(30/30).

� O produto 4 vende-se 50% do total das vendas sendo que toda vez que vende-se 5 tem a probabilidade de 80% (40/50) de tamb�m vender 5.

� O produto 5 vende-se 50% do total das vendas sendo que toda vez que vende-se 5 tem a probabilidade de 80% (40/50) de tamb�m vender 4.

Observa��es: O algoritmo desenvolvido acima s� encontra as duplas ou seja se X ent�o Y.

Aten��o: Esse algoritmo aplicado a grande quantidade de dados (milh�es de registros) com certeza ser� demorado e exigir� muito processamento

Portanto utilizando esse algoritmo conseguimos gerar associa��es, imagine o gestor da empresa de um supermercado por exemplo, saber qual produto sai com qual. Com certeza apartir dessa informa��o pode-se criar um marketing que trar� um retorno sobre isso.

No pr�ximo artigo veremos outro algorimo de Data Mining o K-Means.

Abracos e at� a pr�xima

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Humberto Em 2008

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso