DevMedia
Você precisa estar logado para dar um feedback. Clique aqui para efetuar o login
Para efetuar o download você precisa estar logado. Clique aqui para efetuar o login

Data Mining de Regras de Associação – Parte 3

Neste artigo será apresentado um exemplo de aplicação na mineração de uso da Web.

[fechar]

Você não gostou da qualidade deste conteúdo?

(opcional) Você poderia comentar o que não lhe agradou?

Confirmo meu voto negativo

Data Mining de Regras de Associação – Parte 3

Eduardo Corrêa Gonçalves

Instituto Brasileiro de Geografia e Estatística – IBGE
E-mail: eduardo.correa@ibge.gov.br

1. Introdução

 

Para demonstrar que a técnica para a mineração de regras de associação  possui grande utilidade prática, neste artigo será apresentado um exemplo de aplicação na mineração de uso da Web.  A abordagem utilizada constitui-se na avaliação dos resultados obtidos através da utilização de uma ferramenta de mineração de dados sobre bases de dados reais

 

2. Mineração de Uso da Web

 

Nos dois primeiros artigos desta série, os diferentes tipos de regras de associação e suas medidas de interesse foram apresentados. Este artigo finaliza a série sobre regras de associação, apresentando uma aplicação desta técnica num domínio real: a Mineração do Uso da Web (MUW).

 

A MUW possui o objetivo de investigar a seqüência de visitas a páginas feitas por usuários de um determinado site ou portal da Internet. Desta forma, torna-se possível reconstituir os passos seguidos pelos usuários e também descobrir quais padrões de correlação entre as diferentes páginas.

 

A base de dados escolhida para o teste foi a base de acessos  ao site da Microsoft. Trata-se de uma base transacional que está disponibilizada   no repositório  da  Universidade  da  Califórnia ( http://www.ics.uci.edu/~mlearn/MLRepository.html ). Nesta base, cada transação contém a lista de páginas visitadas por um determinado usuário durante o tempo (sessão) em que ele manteve acesso ao portal da Microsoft. A base é composta por cerca de 33.000 transações, referentes ao  ano de 1998.

 

Para esta avaliação, utilizou-se o programa minerador de regras de associação transacionais denominado RATRANS, que foi desenvolvido em C++ . O software para mineração de regras de associação foi configurado com os seguintes parâmetros: suporte mínimo de 0,1%, confiança mínima de 30% e interesse mínimo de 1,30. A tabela abaixo apresenta algumas das regras obtidas neste experimento, ordenadas de maneira decrescente de acordo com o valor da medida do lift.

 

  

 

Regra de Associação

Sup

Conf

Lift

Job Listings for Pre-Grads Þ Job Openings

0,13%

89,13%

73,62

International IE content Þ Free Downloads

1,23%

46,59%

72,70

Clip Gallery Live Þ MS Publisher

0,13%

33,33%

51,92

VBScript Development Ù ActiveX Technology Development Þ Developer Workshop

0,11%

89,47%

19,81

Image Composer Þ Front Page

0,21%

34,67%

20,70

Sports Þ Games

0,62%

73,55%

16,64

Internet Development  Þ Developer Workshop

1,00%

63,71%

13,89

Knowledge Base  Ù  Support Desktop Þ Windows 95 Support

1,75%

31,78%

5,80

Internet Site Construction for Developers Þ Web Site Builder's Gallery

3,53%

35,87%

5,52

Knowledge Base Þ Support Desktop

5,52%

60,85%

4,47

Internet Explorer Þ Free Downloads

16,08%

56,06%

1,69

Products Ù Windows Family of OSs Þ Free Downloads

1,82%

33,13%

1,41

 

Observe, por exemplo, a regra {International IE content} Þ {Free Downloads}. O valor da medida de suporte indica que 1,29% das pessoas que visitaram o portal da Microsoft consultaram ambas as páginas durante o tempo de permanência da visita: {International IE content} e {Free Downloads}.

 

O valor da medida de confiança indica que a probabilidade de um usuário ter visitados a página {Free Downloads}, dado que ela também visitou {International IE content}  é de 46,59%. E, por fim, o valor da medida de interesse da regra indica que a visita à página {Free Downloads} é nada menos do que 72,70 vezes maior entre os usuários que visitam {International IE content}.

 

Resultados como este demonstram que as regras de associação podem servir como ferramenta de apoio ao processo de tomada de decisões gerenciais. No exemplo em questão, observe que é possível tirar proveito das informações descobertas para identificar os diferentes perfis de usuários que acessam o portal da Microsoft.    

3. Conclusões

 

Neste trabalho foram apresentados e discutidos os diferentes tipos de regras de associação que podem ser minerados a partir de bases de dados. Inicialmente foram descritas as regras de associação transacionais. A seguir discorreu-se sobre as regras multidimensionais, híbridas, multinível e negativas. Além de definições teóricas, foram utilizados exemplos ilustrativos para melhor caracterizar cada uma das diferentes formas que estas regras podem assumir.

 

O trabalho demonstrou a aplicabilidade da técnica para mineração de regras de associação, através da análise dos resultados obtidos através da mineração de uma base de dados real. A partir da análise dos resultados, foi possível demonstrar que as informações contidas nas regras de associação são capazes de auxiliar na identificação do perfil dos usuários de um portal Internet.

 

 

 



Doutorando e mestre em Ciência da Computação pelo Instituto de Computação da Universidade Federal Fluminense (IC/UFF). Atua principalmente nas seguintes linhas de pesquisa: Mineração de Dados, Algoritmos, Banco de Dados e XML.

O que você achou deste post?
Conhece a assinatura MVP?
Serviços

Mais posts