Introdução a Metadados

A tecnologia de metadados surgiu devido às organizações necessitarem conhecer melhor os dados que elas mantêm. Mas o que são metadados? Classicamente, são dados que descrevem dados. Os metadados provêem uma descrição concisa a respeito dos dados. Os dados podem ser documentos, coleção de documentos, gráficos, tabelas, imagens, vídeos, entre tantos outros.

Em banco de dados, informações a respeito dos dados são tão importantes quanto os dados. Os Sistemas de Gerenciamento de Banco de Dados Relacionais - SGBDR também utilizam metadados. As tabelas no banco de dados são usadas para armazenar informações. De forma similar, um SGBDR tem várias meta-tabelas que armazenam descrições das tabelas.

No SGBD Oracle, por exemplo, a tabela USER_TABLES é uma meta-tabela que possui informações a respeito das tabelas criadas pelos usuários. Entre estas informações podem ser encontradas: proprietário da tabela, nome da tabela, nome da tablespace (unidade de armazenamento lógico) para qual foi definida, entre outras.

Outros exemplos de metadados podem ser citados. As definições de classes, em orientação a objetos, são metadados. Os modelos são inerentemente metadados, visto que descrevem os tipos sendo modelados. As aplicações do mundo real, tais como catálogos e dicionários, têm metadados. Implementações de linguagens também utilizam metadados.

Os metadados têm um papel importante na gestão de dados, pois a partir deles as informações são processadas, atualizadas e consultadas. As informações de como os dados foram criados/derivados, ambiente em que reside e/ou residiu, alterações feitas, entre outras são obtidas de metadados. Os metadados fornecem os recursos necessários para entender os dados através do tempo.

É fato que, quem não documenta seus dados, com o decorrer do tempo, fica sujeito à superposição de esforços de coleta e manutenção dos mesmos, e vulneráveis aos problemas de inconsistências. Tendo em vista o exposto, é necessário estratégias para gestão de metadados, visto que não é trivial decidir quais metadados devem ser coletados e mantidos. Uma arquitetura de metadados deve ser flexível para permitir acréscimo ou decréscimo de metadados à medida que novas necessidades apareçam.

Alguns dos problemas detectados para definir estratégias para gestão de metadados estão relacionados ao fato que os metadados tomam uma variedade de formas, novos conjuntos de metadados são criados e diferentes comunidades irão propor diferentes tipos de metadados.

As tarefas para criar um ambiente de gestão de metadados envolvem definir requisitos para metadados que devem estar disponíveis para os usuários e desenvolver uma arquitetura de gestão de metadados e de programas que integram as ferramentas para atender as necessidades das organizações. Além de execução de um programa de treinamento aos usuários, visto que representar a descrição de dados não é uma tarefa fácil, e que um mesmo dado pode ser descrito de várias formas, tanto por usuários distintos, quanto por um mesmo usuário em momentos distintos.

No próximo artigo, iremos descrever a classificação de metadados e padrões de metadados existentes.