Muitas organizações possuem problemas com a qualidade de seus dados, mas o principal problema localiza-se nos dados críticos para o negócio. Mesmo em empresas que reconhecem a importância da qualidade de seus dados, estas não hesitam em atacar esses problemas como uma iniciativa crítica. Inúmeros praticantes de qualidade de informação percebem que a razão para isto não é o mal entendido no âmbito ou no tamanho dos problemas, mas sim devido a dois principais problemas fundamentais:

  • A incapacidade de convencer a gestão da empresa sobre a importância da manutenção da melhoria da qualidade de seus dados, resultado de orçamentos limitados e de falta de governança;
  • A abrangência dos problemas de dados endereça no mercado a ausência de profissionais capacitados a descobrir por onde iniciar a resolução destes problemas.

Uma abordagem que tem tido sucesso em lidar com estas questões gira em torno da avaliação de qualidade dos dados, o que ajuda a produzir algumas métricas sobre o tamanho dos problemas da qualidade de dados, a ajudar a determinar quais os problemas são mais críticos para o negócio e a auxiliar a determinar os passos iniciais que precisam ser tomados para resolver tais problemas.

Uma das questões mais frustrantes associadas com a melhoria da qualidade de dados é não saber como os dados “ruins” realmente afetam a organização. Em algumas empresas, os métodos para tratar a má qualidade dos dados podem incorporar correções provisórias de dados, ajustes nominais de serviços de clientes, réplicas de dados não harmonizados, ou outras soluções "típicas" as quais incorrer em algumas "correções" nos custos da empresa, mas provavelmente não abordam a fonte do problema. Na verdade é possível que, apesar da existência de dados que não são compatíveis com as expectativas do gestor de conhecimento, os custos associados, que fixam os problemas sobrecarregam os custos de correção acima mencionados.

O conceito de qualidade dos dados em uma avaliação de retorno sobre o investimento (ROI) tem como objetivo fornecer um conjunto de métricas que destacam os problemas de qualidade de dados mais críticos, e amarrar essas questões com os problemas reais de negócios, que podem ser relacionadas ao aumento dos custos ou com oportunidades perdidas. Calculando o alcance dos custos reais desses problemas de negócios e, em seguida, comparando com os custos da demora em melhorar a qualidade de dados encontramos um modelo de ROI indescritível.

Este modelo de ROI pode ser utilizado para tratar os obstáculos acima mencionados, fornecendo métricas bem definidas e medidas reais, amarrando-as a problemas reais de negócio, este modelo constrói argumentos para o gerenciamento maduro de apoio às iniciativas de melhoria de qualidade de dados. Destacando as questões mais críticas de dados, este modelo oferece um ponto de partida para os processos de melhoria continua.

Podemos dividir os custos associados à má qualidade dos dados entre custos intangíveis, que são claramente evidentes, mas ainda difíceis de medir, e custos fixos, cujos efeitos podem ser estimados e medidos. Em última análise, o nível de qualidade dos dados permeia até a base inferior da companhia - permitindo baixos níveis de qualidade dos dados que irão reduzir os lucros, enquanto a melhora da qualidade deve aumentar os lucros de empresa.

Custos fixos são aqueles cujos efeitos podem ser estimados e/ou medidos. Estes incluem:

  • Atrito com os clientes
  • Detecção de erros
  • Erro de retrabalho
  • Prevenção de erros
  • Atendimento ao cliente
  • Correção dos problemas dos clientes
  • Atrasos no processamento
  • Projetos adiados ou cancelados

Custos intangíveis são aqueles que são evidentes, tem um efeito claro sobre a produtividade, mas são difíceis de medir. Estes incluem:

  • Dificuldade na tomada de decisões
  • Atrasos no tempo das operações
  • Desconfiança Organizacional
  • Redução da capacidade para competir eficazmente
  • Propriedade conflitos de dados
  • Redução da satisfação dos colaboradores

Os custos podem ser manifestados com uma ou mais destas classificações de impacto específicas:

AtritoOcorre quando há reação de um cliente sobre maus resultados de qualidade de dados na cessação completa do cliente de negócios.
BloqueioOcorre quando há insatisfação de um cliente é tão completa que faz com que outros clientes em potencial decidem não fazer negócios com a organização.
CorreçãoEstão associados com a correção efetiva de um problema, bem como o reinicio de quaisquer processos ou atividades com falha. A quantidade de tempo associado com a atividade que falhou, juntamente com as atividades estranhas empregadas, são todas envolvidas nos custos de correção.
DetecçãoSão incorridos quando um erro do sistema ou falha de processamento ocorre e um processo é chamado para controlar o problema.
GarantiaSão aqueles associados com a correção dos problemas e com a compensação dos clientes por danos.
PrevençãoSão aqueles incorridos quando uma nova atividade é projetada, implementada e integrada para identificar problemas de qualidade de dados e tomar as ações necessárias para evitar falhas operacionais devido a problemas inesperados de dados.
ReduçãoOcorre quando existe a decisão de um cliente em fazer menos negócios com a organização decisão esta relativa a resultados do problema de qualidade de dados.
Retrabalhoepresentam o trabalho realizado ainda antes da fase de sucesso ocorrer.
ReversãoCobrem os custos associados com o trabalho de destruição do que já foi feito.

Tabela 1: Classificação de Custos

Melhorar a qualidade dos dados pode adicionar uma linha base na companhia, seja através de otimização em sistemas operacionais ou melhorando o valor do conhecimento gerado através de um processo de inteligência de negócios. Os seguintes tipos de melhorias são típicos como resultado da melhora da qualidade da informação:

  • Melhoria na transferência para o processamento de volume de dados - Ao reduzir os atrasos associados à detecção e correção de erros de dados, e/ou retrabalho associado à correção, mais transações podem ser processadas, resultando em processamento de maior volume e menor custo por transação.
  • Perfil do cliente melhorado - Ter a informação do cliente mais completa que permita ao processo de inteligência de negócios fornecerem perfis dos clientes mais precisos, que por sua vez pode levar ao aumento nas vendas, melhor atendimento ao cliente e retenção de clientes.
  • Redução de recursos de requisitos de dados redundantes - Eliminação de dados redundantes e redução da quantidade de retrabalho reduzem a tensão e proporcionam melhor alocação e utilização de recursos para a produção de requisitos de dados.

Uma proposta de valor para a Avaliação de Qualidade de Dados vem através da avaliação completa dos sistemas e é obrigatória para o fornecimento de um ROI abrangente, mas normalmente é uma avaliação limitada e é eficaz em isolar problemas significativos que podem estar diretamente relacionadas ao aumento dos custos, bem como fornecer informações sobre a direção de uma melhoria que o processo deve levar. O processo que pode auxiliar nesta avaliação da qualidade de dados está descrito na Figura 1.

Processo de Avaliação de Qualidade de Dados

Figura 1: Processo de Avaliação de Qualidade de Dados

  • Profile - Esquema de perfil de dados para avaliar as colunas padrão e transversais do pilar-análises, tais como frequência, nulidades, cardinalidade, etc. Esta atividade geralmente expõem alguns dos mais problemáticos problemas de qualidade de dados, que devem ser resumidos na fase seguinte;
  • Review - Os resultados do perfil devem ser discutidos com o cliente de negócios para determinar quais dos problemas estão relacionados com problemas de negócios. Momento para documentar as regras de negócio que caracterizam as expectativas como um prelúdio para medição real.
  • Measure - Agora tendo a lista de problemas críticos de qualidade de dados, bem como os problemas de negócio a que se referem. O próximo passo é medir não apenas o cumprimento das informações para as regras de negócio definidas, mas também para medir os custos reais associados ao abandono.
  • Characterize Solution - Tendo medido a conformidade das regras de qualidade dos dados e o descumprimento associado com os custos reais, agora temos que propor soluções para estes problemas e fornecer estimativas de custo para essas soluções, bem como estimar o aumento no valor quando esses problemas foram resolvidos.
  • Build – Com as informações suficientes disponíveis para completar o modelo de ROI, que enumera os custos associados com a má qualidade dos dados, os custos para a correção dos problemas, e as prestações de contas de como melhorar a qualidade. Isso nos dá uma visão em alto nível de uma proposta de valor para a melhoria da qualidade dos dados.

Construir um modelo de retorno sobre o investimento (ROI) para a qualidade dos dados é um processo de negócio valioso que exige um pequeno investimento em tempo e energia e ainda oferece uma valiosa documentação sobre o escopo e os custos associados à má qualidade dos dados. Realizar uma avaliação limitada da qualidade dos dados produz métricas importantes sobre o tamanho dos problemas da qualidade de dados, ajuda a destacar os problemas que são mais críticos para o negócio, ajuda a determinar os passos iniciais que precisam ser tomados para resolver o problema. Mais importante ainda, o modelo de ROI fornece um argumento irrefutável para convencer gerentes seniores da importância do cumprimento da qualidade dos dados.

Agradeço a atenção de todos os leitores.