A Importância da Qualidade dos Dados na Visão de Negócios
A imensa disponibilidade de informações, provenientes de diferentes fontes de dados, representam um excelente acervo estratégico às diversas áreas de negócio das organizações, que deverá ser potencializado por meio da implementação de processos de qualidade de dados pela administração de dados das organizações. Entretanto, atualmente, com a pouca relevância que a administração de dados têm dentro das organizações, raramente encontra-se uma integração capaz de fornecer uma visão única, de forma que possibilite a utilização correta e eficaz destas bases de dados.
Além disso, a temporariedade dos dados, causada pela velocidade com que as mudanças dos mesmos ocorrem, traz para as organizações uma problemática específica de administração da qualidade de dados. Essa questão só pode ser tratada adequadamente quando contamos com metodologia específica, profissionais com conhecimento e experiência e ferramentas adequadas.
Quando não contamos com uma administração de dados ativa e eficiente na monitoração da qualidade dos dados e levando em conta o grande número de processos de extração de dados e as regras de negócio cada vez mais complexas a probabilidade de encontrarmos problemas na qualidade e integridade dos dados se torna imensa. Outro ponto a ser considerado é o volume de dados, normalmente, as grandes bases tendem a ter uma qualidade inferior se comparadas às menores, porque qualquer ação ou ajuste para a correção de um problema requer um tempo de processamento significativamente elevado. Isso faz com que os técnicos sejam obrigados a conviver com certas regras em processos para contornar a situação. Regras que raramente estão bem documentadas, aumentando geometricamente a complexidade das rotinas de extração e integração.
A existência de dados errados ou inconsistentes podem originar enormes custos para uma organização, tanto visíveis, custo de correspondência devolvida e ações de telemarketing mal sucedidas, quanto não visíveis, tentativas das organizações de ‘darem um jeito’ nos dados ou a imagem negativa que os clientes têm da organização.
Além disto, os investimentos realizados em sistemas de apoio à tomada de decisão, como Business Intelligence, objetivando a criação do Data Warehouse, podem estar em jogo se os usuários detectam que as informações não têm qualidade.
Como boa pratica para controle de qualidade dos dados, devemos ter:
? Uma área de administração de dados, envolvida diretamente com a visão do negócio e preocupada com a qualidade dos dados;
? Emprego de metodologia para controle de qualidade, cujo objetivo principal seja criar um processo interativo de melhoria constante da qualidade dos dados e dos processos que com eles lidam, de forma a garantir a obtenção de um nível aceitável de ausência de erros;
? Utilização de ferramenta de reengenharia da qualidade de dados, que cobrirá as tarefas de investigação e análise de dados e fases posteriores como padronização, retirada de duplicidades e enriquecimento de dados, até a obtenção dos dados finais a serem devolvidos “limpos”, esta ferramenta deverá ser orientada à “purificação de dados” nos seus aspectos mais complexos, por exemplo, tratamento de campos de texto livre e regras de negócio específicas;
? Tratamento da qualidade de dados on-line, diretamente na sua origem, na qual emprega-se novamente a utilização de uma ferramenta de reengenharia da qualidade de dados que utilize recursos “real-time”, que possibilite a identificação única e o tratamento dos dados no momento da captura, por meio do uso de regras e tratamentos para identificação de dados duplicados e a aplicação de outras validações objetivando a correção imediata de um dado.