Uma das características mais marcantes no funcionamento dos computadores é que eles operam basicamente sobre elementos de Dados, que constantemente são processados com outros dados gerando informações, que por sua vez processadas geram novas informações e se transformam em conhecimento na medida em que são consumidos pelos usuários destes computadores.

Os Dados são representações de fatos e conceitos que se supõem existirem no mundo real ou no mundo ideal. Informações podem ser entendidas como uma possível inferência a partir de um conjunto de dados inter-relacionados que possibilitam uma decisão ou uma ação tanto por humanos como por máquinas.

Durante muito tempo designamos como CPD (Centro de Processamento de Dados) as dependências de armazenamento e manipulação dos Dados das corporações, hoje estes centros evoluíram e atualmente denominamos como Data Centers (Centros de Dados) as dependências onde os dados são armazenados e que também sofrem uma grande quantidade de processamento. Estes centros muitas vezes são projetados para garantir às empresas o atendimento dos requisitos de negócios, bem como, atender a regulamentações legais ou até mesmo para possibilitar um ganho de escala no potencial competitivo da corporação.

Com o crescimento no potencial de armazenamento e processamento dos atuais Centros de Dados, as instituições vêm enfrentando novas adversidades para o gerenciamento de um de seus principais ativos, os dados. Um grande número de novas tecnologias despejadas no mercado de Tecnologia da Informação (TI) faz com que os Dados tenham em sua forma mais primitiva, uma diversidade tão grande de novos formatos que muitas vezes os profissionais de TI não acompanham de forma satisfatória, tal evolução e acabam tratando estes desconhecidos, novos e importantes dados, com pouca importância. Esta diversidade de dados incluem dados estruturados já amplamente conhecidos e com técnicas muito bem estruturadas para o seu gerenciamento, mas também abordam formatos que atualmente são classificados como Big Data, e que muitos profissionais ainda necessitam entender suas características para que o seu gerenciamento seja mais efetivo e assertivo. No contexto dos dados classificados como "BIG DATA", algumas propriedades já conhecidas ao longo dos tempos pelos Administradores de Dados acabam tendo uma nova perspectiva sobre a infraestrutura, o desenvolvimento e com as definições de negócio das corporações. A relação dos 3 V's (Variedade, Velocidade e Volume) dos dados nos ambientes informacionais é o reflexo da evolução tecnológica de nossos sistemas e das diversas plataformas de informação disponíveis para os ambientes corporativos. Big Data é grandes volumes, velocidade e variedade de ativos de informação que exigem baixo custo e formas inovadoras no processamento das informações para melhorar a compreensão e a tomada de decisões.

Talkingonlyabout big data can lead to self-delusion, são palavras de Donald Feinberg – Gartner, e mostra que não devemos somente nos preocupar com o advento destas novas tendências na forma de controlarmos os dados.


A maior dificuldade no gerenciamento de informações são as questões emergentes da interação simultânea e persistente de grandes volumes, da variedade de formatos, da velocidade de criação de registros junto às variáveis latentes e da complexidade dos tipos de dados individuais dentro dos seus formatos. O "peso" das exigências de processamento de dados está aumentando constantemente e sobrecarregando as tecnologias existentes. Isto cria um balanço permanente entre a capacidade de nossos sistemas e a demanda sobre eles para processar estas informações.

No contexto da alta gestão das corporações o Dado ou o Dado Grande (Big Data) é somente mais uma importante peça no quebra-cabeça que é a Administração de Empresas, mas não significa que elas não entendam a sua importância e não invistam em sua administração. Muito ainda pode ser feito para o efetivo gerenciamento dos Dados, mas poucos o fazem em sua plenitude.

A Administração de Dados tem por característica principal atuar na fase de Desenvolvimento das soluções de sistemas das empresas como uma equipe centralizadora e muitas vezes considerada como burocrática para o atendimento das necessidades dos gestores de negócio. Este é um processo que tem como responsabilidade manter a aderência das estruturas de armazenamento de dados das soluções com as necessidades de negócio, este processo deve considerar as necessidades de negócio, mas principalmente deve presar por aplicar as boas práticas na gestão das estruturas de dados. Os principais direcionados de arquitetura, modelagem de dados, armazenamento e administração dos bancos de dados, segurança e acesso das informações podem ser aplicados de forma empírica ou através de direcionadores estruturados em frameworks de governança e gestão de dados, estes frameworks trazem boas práticas que são a compilação de diversas iniciativas de implementações e de direcionadores de teóricos experientes no assunto.

Em síntese a Administração de Dados tem por principais responsabilidades o gerenciamento efetivo dos modelos de dados, e este gerenciamento deve inicialmente garantir os processos básicos para a atividade de modelagem, que são:

  • Definição dos padrões, regras e normas de modelagem de dados;
  • Manutenção do glossário de termos de negócio;
  • Manutenção dos modelos de dados (lógico/físico);
  • Homologação da qualidade dos modelos de dados;
  • Sustentação dos processos de análises de impacto nas mudanças de TI.

Estas atividades sugeridas devem ser direcionadas e implantadas nas corporações conforme os direcionamentos estratégicos das equipes de tecnologia da informação, mas sem esquecer que para atender efetivamente o conceito de administração dos modelos de dados, todas as responsabilidades da disciplina devem ser contempladas no processo de construção das aplicações, mesmo que com uma descentralização nas responsabilidades pelas tarefas básicas.

Agradeço a atenção de todos os leitores.

Leia também: