Mineração de dados (data mining): transformação de bases de dados transacionais

Por que eu devo ler este artigo:A utiliza��o de tarefas de minera��o de dados est� cada vez mais comum em sistemas comerciais, sendo elas cada vez mais necess�rias em ambientes corporativos nos quais � preciso tomar decis�es r�pidas e inteligentes baseadas nos dados hist�ricos e comportamentais das empresas. Sistemas de informa��o transacionais apresentam esquemas de bases de dados que nem sempre s�o adequados para esses prop�sitos, dessa forma, faz-se necess�rio o entendimento de como transformar uma base de dados transacional em um formato espec�fico no qual as tarefas de minera��o de dados possam ser executadas.
Autores: Jones Granatyr, Bruno Mateus Casali, Rafael Sousa da Silva, Jos� Adair Fabricio, Alan Diego Darold, F�bio Alexandre Taffe

As bases de dados transacionais s�o aquelas que armazenam os dados di�rios de uma determinada empresa, sendo alimentadas pela utiliza��o dos sistemas de informa��o transacionais. Nesse tipo de sistema o objetivo � realizar as opera��es do dia a dia em um setor espec�fico, ou seja, o esquema da base de dados est� preparado para suprir essa necessidade. Por exemplo, em um cen�rio de mercado s�o necess�rias estruturas de tabelas para possibilitar o controle dos principais processos desse setor, tais como controle de estoque, venda dos produtos e emiss�o de cupom fiscal. Em outras palavras, esses sistemas est�o preocupados com as opera��es b�sicas realizadas sobre os dados, tais como inclus�o, altera��o, exclus�o e consulta.

Por�m, quando � necess�rio aplicar t�cnicas de minera��o de dados objetivando a tomada de decis�o no n�vel gerencial da empresa, na maioria das vezes os esquemas transacionais n�o s�o adequados para a aplica��o dos algoritmos correspondentes. Isso ocorre porque esses algoritmos necessitam que os dados estejam em um padr�o pr�-determinado, ou seja, a base de dados transacional necessita ser convertida para um formato no qual eles possam ser aplicados.

Dentro desse contexto, a minera��o de dados objetiva aplicar tais algoritmos em bases de dados com o intuito de encontrar automaticamente algum tipo de padr�o ou auxiliar em processos de tomada de decis�o. Existem diversas tarefas de minera��o de dados e as principais s�o: classifica��o, regress�o, detec��o de desvios, descoberta de regras de associa��o, agrupamento e descoberta de padr�es sequenciais. Cada uma delas objetiva encontrar rela��es distintas nos dados e s�o aplicadas a cen�rios espec�ficos. A classifica��o, como o pr�prio nome sugere, tem o intuito de classificar os registros em classes: por exemplo, bancos utilizam essa t�cnica para indicar se o risco de conceder um empr�stimo para um cliente � alto, m�dio ou baixo. Desse modo, o cliente � categorizado em uma dessas tr�s classes para que o banco possa tomar a decis�o se deve ou n�o liberar o empr�stimo.

A regress�o, por sua vez, trabalha com atributos num�ricos e uma aplica��o pr�tica � prever o limite do cart�o de cr�dito de um cliente com base em seus gastos mensais. J� a detec��o de desvios � utilizada para encontrar outliers, ou seja, registros que est�o muito fora de um padr�o que vem ocorrendo h� um certo tempo. Essa t�cnica � comumente aplicada para detectar fraudes em cart�o de cr�dito tomando como base o padr�o de compra do cliente, dessa forma, caso o sistema detecte alguma compra fora do padr�o o cart�o pode ser bloqueado. Por outro lado, a descoberta de regras de associa��o visa encontrar relacionamentos entre os dados, e o exemplo cl�ssico � o do cen�rio do supermercado, no qual se objetiva encontrar quais s�o os produtos que s�o vendidos em conjunto para planejar a disposi��o e organiza��o das prateleiras.

A tarefa de agrupamento, por sua vez, tem o intuito de analisar os dados e formar grupos semelhantes. Por exemplo, em um cen�rio de uma loja de departamentos um grupo pode ser composto pelos clientes interessados em acess�rios de beleza, enquanto que outro grupo pode ser formado por pessoas interessadas em eletr�nicos. Com isso, � poss�vel segmentar o mercado e enviar propagandas somente para os clientes que possuem maiores chances de comprarem os produtos. Por fim, a �ltima tarefa de minera��o de dados diz respeito � descoberta de padr�es sequenciais, ou seja, objetiva-se prever o que acontecer� no futuro com base em um comportamento atual. Por exemplo, se um leitor comprar o livro �SQL B�sico�, a loja saber� que no futuro ele comprar� o livro �SQL Avan�ado� e enviar� um e-mail com uma promo��o, por exemplo.

Neste artigo ser�o abordadas com mais detalhes somente as tarefas de classifica��o e descoberta de regras de associa��o, pois a transforma��o das duas bases de dados deste exemplo est� relacionada a essas tarefas. A pr�xima se��o explana melhor sobre as duas t�cnicas.

Classifica��o e descoberta de regras de associa��o

A tarefa de classifica��o tem o intuito de associar cada registro da base de dados a uma classe pr�-definida. Para que isso seja poss�vel s�o necess�rios dois pr�-requisitos: um conjunto de atributos previsores e um atributo meta. A Figura 1 apresenta um exemplo e pode-se observar que existem tr�s atributos previsores (sexo, idade e n�mero de dependentes) e um atributo meta (gasta muito). Dessa forma, a tarefa de classifica��o busca encontrar uma rela��o entre os atributos previsores com o atributo meta, ou seja, objetiva-se responder a seguinte quest�o: ser� que o sexo, a idade e o n�mero de dependentes influencia no valor que o cliente ir� gastar na loja? Com isso, � poss�vel construir um sistema inteligente no qual se possa prever se o cliente ir� gastar muito ou gastar pouco com base em suas caracter�sticas. A base de dados da Figura 1 j� est� com o atributo meta definido, por�m, quando um sistema desse tipo for constru�do do zero, uma an�lise deve ser realizada na base de dados transacional com o intuito de encontrar e/ou definir o atributo para o qual as previs�es ser�o realizadas. Em suma, recomenda-se que o objetivo da classifica��o (atributo meta) esteja definido antes de iniciar os pr�-processamentos para a transforma��o da base de dados transacional.

Os algoritmos de classifica��o possuem uma m�trica comumente utilizada para avaliar sua acuidade, geralmente dada pelo percentual de acerto e de erro. Para realizar essa avalia��o, a base de dados � dividida em duas por��es distintas: a de treinamento e a de teste. A base de treinamento � utilizada para que o algoritmo aprenda com os dados, enquanto que a base de t ...

Quer ler esse conteúdo completo? Tenha acesso completo

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Devmedia Em 2017

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Minera��o de dados: transforma��o de bases de dados transacionais

Veja neste artigo como adaptar bases transacionais para aplica��o da tarefa de classifica��o e descoberta de regras de associa��o em formato de minera��o de dados.