Minera��o de Reposit�rios de Software: A Computa��o ajudando � Computa��o.

Minera��o de Reposit�rios de Software: A Computa��o ajudando � Computa��o.

por Methanias Cola�o J�nior

Caros Leitores,

neste artigo, introduziremos e apresentaremos as possibilidades de descoberta de conhecimento em projetos de softwares, imprescind�veis para tomada de decis�o de seus Gerentes.

Nos �ltimos dez anos, com a coleta intensiva de dados e conseq�ente explos�o de informa��es dispon�veis nas diversas �reas da ci�ncia, a minera��o de dados tem se apresentado como uma abordagem importante para descoberta de tend�ncias e padr�es previamente desconhecidos em reposit�rios de dados. Entretanto, t�cnicas de minera��o precisam ser desenvolvidas ou adaptadas para tarefas e dom�nios espec�ficos. Na Engenharia de Software (ES) n�o � diferente, necessita-se de abordagens espec�ficas para se minerar os dados que s�o provenientes da constru��o de software.

Entre as fontes de dados pass�veis de an�lise podemos citar: bases de c�digo est�tico, hist�rico de vers�es do software, rastros de execu��o de programas, relat�rios de erros, listas de discuss�o e logs de implanta��o de sistemas. Mas como esses dados s�o armazenados ?

Durante a manuten��o e o desenvolvimento de software, programadores escrevem novo c�digo, relat�rios, acrescentam novas funcionalidades ao software, corrigem defeitos, discutem as altera��es atrav�s de listas de discuss�o e e-mails, entre outras atividades. Atualmente, a utiliza��o de ferramentas de software integradas e acopladas �s atividades de desenvolvimento tem crescido consideravelmente, permitindo que sejam armazenados dados do processo de desenvolvimento automaticamente. � poss�vel recuperar esses dados e transform�-los em informa��o valiosa para o aperfei�oamento do processo de desenvolvimento. Assim como fontes de outras �reas, os dados da Engenharia de Software podem ser minerados, resultando no descobrimento de padr�es e regras que podem melhorar a qualidade dos softwares desenvolvidos, bem como aumentar a produtividade dos mesmos.

Diversas tarefas podem ser auxiliadas. Vejamos algumas delas:

Programa��o

Se pensarmos em n�vel de constru��o de software, existem questionamentos b�sicos que acompanham um programador em suas tarefas de desenvolvimento, enumeramo-los:

� Qual a categoria do software ?. Para aprendizado das melhores pr�ticas e para promo��o do reuso;

� Como usar uma API (Application Program Interface) corretamente ?;

� Como invocar um objeto ou um m�todo do mesmo ?;

� Como lidar com um m�todo antes e depois da execu��o do mesmo ?;

� Quais componentes devem ser reusados e qual a melhor maneira de reus�-los ? Devem ser usados de forma combinada ?;

� Como o c�digo foi alterado em outras vers�es ?.

Desta forma, a minera��o de dados pode ajudar, por exemplo, a: (1) Identificar caracter�sticas de uso de uma API ou framework automaticamente; (2) Manter os padr�es de uso atualizados, baseando-se sempre na mais nova vers�o da API ou framework; (3) Identificar padr�es que abranjam casos de heran�a em frameworks.

Detec��o de defeitos

Todo sistema segue algumas regras para se manter correto, contudo, na maioria das vezes, essas regras n�o s�o documentadas. A deriva��o dessas regras requer um conhecimento pr�vio muito grande e as t�cnicas de minera��o de dados podem ajudar a inferir essas regras do c�digo-fonte.

Por exemplo, muitos erros em programa��o s�o causados pela falta de combina��o indispens�vel de alguns m�todos. Uma ocorr�ncia cl�ssica � a chamada de um m�todo para desalocar mem�ria por uma estrutura de dados que n�o foi instanciada e vice-versa (malloc, free). Em outras palavras, defeitos podem ser detectados pela aus�ncia do padr�o inferido de combina��o, sendo corrigidos com apenas uma altera��o no c�digo-fonte.

Depura��o

Diversas aplica��es, principalmente as de c�digo aberto, possuem reposit�rios de erros, os quais possuem relat�rios dos erros e poss�veis solu��es. Estes relat�rios consomem tempo de desenvolvimento e muitas vezes s�o duplicados, contudo, s�o um compendio valioso de informa��es.

Desta forma, t�cnicas de minera��o podem ser utilizadas para tentar predizer se h� probabilidade da gera��o de um erro, dado um estado S de um programa e um evento E.

Manuten��o

Toda manuten��o de software se inicia em um ponto espec�fico do programa. Minerar dados do hist�rico de altera��es armazenado em sistemas de controle de vers�o pode ajudar programadores com sugest�es do tipo: �Programadores que alteraram esse m�todo tamb�m alteraram o(s) m�todo(s) ...�.

Isso pode ser utilizado em granularidades maiores, tais como diret�rios, m�dulos e arquivos, bem como em granularidades menores, tais como m�todos, se��es ou vari�veis.

Vejamos a seguir dois exemplos de ferramentas de minera��o de software.

ChangeMiner (http://sites.google.com/site/frchico/changeminer)

O ChangeMiner usa regras de associa��o para minerar o hist�rico de vers�es e orientar programadores com sugest�es do tipo: �Programadores que alteraram esse m�dulo tamb�m mudaram o(s) m�dulo(s)...�. Dado um conjunto de mudan�as existentes, regras sugerem e predizem mudan�as prov�veis, identificam acoplamentos e previnem erros provenientes de mudan�as incompletas.

NeuroMiner (www.neurominer.com)

O Neurominer � um ambiente que utiliza os princ�pios da Programa��o Neurolingu�stica para extrair das listas de discuss�o de um projeto o canal cognitivo mais usado pelos desenvolvedores (Sistema de Representa��o Preferencial (SRP) Contextual). Isso ajuda na tomada de decis�o de aloca��o de desenvolvedores, bem como tra�a o perfil psicol�gico de cada colaborador ou cliente da organiza��o, fazendo-se uso de qualquer texto que represente uma manifesta��o dos mesmos.

Em novos artigos, abordaremos como melhorar a qualidade dos dados de reposit�rios de sistemas atrav�s de Data Warehousing para Engenharia de Software. Al�m disso, a minera��o de textos tamb�m ser� abordada em breve.

Abra�os,

Methanias

Confira outros conte�dos:

Por Methanias Em 2010

Minera��o de Reposit�rios de Software: A Computa��o ajudando � Computa��o.

Descoberta de padr�es em Engenharia de Software

Confira outros conte�dos: