Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

Aten��o: esse artigo tem um v�deo complementar. Clique e assista!

De que se trata o artigo:

Neste artigo conheceremos as formas de captura de dados existente no SQL Server 2008, atrav�s do Change Data Capture. Em seguida, demonstraremos como realizar a captura destes dados, com base em uma tabela contendo dados fict�cios.

Para que serve:

Atrav�s do Change Data Capture, torna-se poss�vel a cria��o de um reposit�rio ou hist�rico de dados, oferecendo a sua organiza��o criar e manter uma base de conhecimento. Esta base de conhecimento dever� ajudar a estabelecer o n�vel de import�ncia sobre as informa��es manipuladas diariamente, fazendo com que os Diretores, Gerentes e Administradores avaliem o quanto esta informa��o � importante e como ela poder� ajudar na tomada de decis�o a curto ou m�dio prazo.

Em que situa��o o tema �til:

A captura de dados � uma t�cnica �til para ambientes que apresentam processamento di�rio de informa��es. Atrav�s dos trabalhos de captura de dados, podemos criar uma organiza��o sobre os dados manipulados, estabelecendo regras de controle e auditoria. Utilizando os recursos existentes no Change Data Capture, torna-se poss�vel automatizar ainda mais as formas de coleta e categoriza��o de informa��es.

Com o passar do tempo, o volume de informa��es armazenadas em uma tabela pode crescer de forma consider�vel, tornando-se um grande reposit�rio. Este crescimento � provocado pela manipula��o de dados, mais precisamente por inser��es e atualiza��es que ocorrem constantemente em uma tabela.

Com o objetivo de analisar, identificar e documentar todas as a��es que ocorrem em um banco de dados e suas tabelas, o SQL Server 2008 apresenta uma nova funcionalidade, chamada Change Data Capture ou Captura de dados de altera��es.

Neste artigo apresentaremos esta nova funcionalidade, fornecida a partir das vers�es Enterprise, Developer e Evaluation.

Entendendo o Change Data Capture

O Change Data Capture � considerado uma das maiores inova��es adicionadas ao SQL Server. Atrav�s desta funcionalidade torna-se poss�vel realizar dois processos: o primeiro � chamado de captura dos dados alterados em tempo real e o segundo � denominado rastreamento de dados alterados.

O processo de captura de dados baseia-se na utiliza��o dos comandos de manipula��o de dados (INSERT, UPDATE e DELETE), mais conhecidos como comandos DML (Data Manipulation Language). Este processo utiliza um mecanismo de identifica��o e captura de dados chamado inst�ncia de captura de dados de altera��o, conforme veremos nos pr�ximos t�picos.

Esta inst�ncia possui a finalidade de observar a execu��o dos comandos DML e, conforme estes comandos s�o processados, a inst�ncia se encarrega de gerar uma c�pia para ser posteriormente armazenada em tabelas utilizadas pelo Change Data Capture.

O processo de rastreamento de dados alterados tem como finalidade pesquisar e informar quais os dados j� foram alterados. Atrav�s de fun��es e stored procedures o SQL Server consegue obter estas informa��es.

Com a utiliza��o do Change Data Capture, o SQL Server cria um ambiente �nico para a realiza��o destes dois processos, evitando a utiliza��o de demais recursos ou t�cnicas complementares. Este ambiente � composto por diversos componentes espec�ficos, como veremos aqui.

O funcionamento do Change Data Capture

O funcionamento do Change Data Capture pode ser considerado simples, tendo como base a execu��o de comandos DML. Mas existe outro elemento muito importante que disponibiliza as informa��es sobre os dados alterados. Este elemento � o Log de Transa��es ou Transaction Log, existente em qualquer banco de dados, respons�vel por armazenar informa��es sobre todos os procedimentos realizados.

A partir do log, o Change Data Capture identifica quais dados foram alterados, repassando estas informa��es para o processo de captura. Este, por sua vez, repassa este mesmo dado para as tabelas utilizadas para o armazenamento de dados alterados, ou seja, uma c�pia do dado � armazenada em tabelas.

Essa sequ�ncia de atividades � conhecida como Fluxo de Dados Processados, como pode ser visto na Figura 1.

Figura 1. Fluxo de dados realizado durante o processo de captura de dados

Conforme os dados s�o inseridos de forma incremental em outras tabelas ou fontes de dados externas (data mart ou data warehouse), o Change Data Capture consegue capturar o volume de informa��es que est� sendo manipulada a partir do log de transa��es.

Se considerarmos que este processo de captura poder� ser realizado constantemente em nosso ambiente durante um per�odo de tempo, podemos criar alguns indicadores de informa��o que nos permitem dimensionar:

� Quantidade de linhas de registros processadas;

� Quantidade de inser��es realizadas;

� Quantidade de atualiza��es realizadas;

� Volume ou tamanho de dados processados, etc.

Estes indicadores podem ser informa��es importantes para um administrador de banco de dados tomar diversas decis�es relacionadas ao processamento e consumo de recursos realizadas sobre um banco de dados ou tabela.

O processo de captura se encerra a partir do momento que as fun��es de consulta de dados utilizadas pelo Change Data Capture s�o desabilitadas. Atrav�s do trabalho realizado pela inst�ncia de captura, torna-se poss�vel catalogar e retornar informa��es sobre os dados alterados. Estas fun��es s�o conhecidas como CDC functions.

Al�m disso, o processo de captura de dados tamb�m pode ser aplicado em conjunto com ferramentas e tecnologias ETL durante o processo de inser��o de dados em tabelas ou fontes de dados externas, como data warehouse ou data marts.

Os recursos utilizados pelo Change Data Capture

Para realizar os processos de captura e rastreamento de dados alterados o SQL Server utiliza alguns recursos para trabalhar com o Change Data Capture. Organizados de acordo com sua funcionalidade, s�o eles:

� Tabela de Altera��o;

� Inst�ncia de Captura de dados;

� Tabela de Origem;

� Change Data Capture Agent.

Tabela de Altera��o

A tabela de altera��o � associada a uma tabela que est� sendo utilizada pelo Change Data Capture. Ela apresenta em sua estrutura algumas particularidades para possibilitar o controle do fluxo de dados ocorrido sobre determinada tabela. Dentre estas particularidades destacamos as cinco primeiras colunas de metadados, onde cada coluna fornece informa��es adicionais pertinentes �s altera��es registradas.

As colunas restantes espelham as colunas capturadas sobre a tabela de origem, respeitando o nome e tipo de dados de cada coluna. Cada opera��o de inser��o ou exclus�o que � aplicada a uma tabela de origem aparece como uma �nica linha dentro da tabela de altera��o.

As colunas de dados da linha que s�o o resultado de uma opera��o de inser��o cont�m os valores de coluna depois da inser��o. As colunas de dados da linha que s�o o resultado de uma opera��o de exclus�o cont�m valores de coluna antes da exclus�o. Uma opera��o de atualiza��o requer uma entrada de linha para identificar os valores da coluna antes da atualiza��o e uma segunda entrada para identificar os valores da coluna depois da atualiza��o.

Cada linha em uma tabela de altera��o tamb�m cont�m metadados adicionais para permitir a interpreta��o da atividade de altera��o.

� A coluna __$start_lsn identifica o n�mero da seq��ncia do log de confirma��o (LSN) que foi atribu�do � altera��o. O LSN de confirma��o n�o s� identifica altera��es que foram confirmadas dentro da mesma transa��o, mas tamb�m ordena essas transa��es;

� A coluna __$seqval pode ser usada para ordenar mais altera��es que acontecem na mesma transa��o, por exemplo, uma sequ�ncia de registros que est�o sendo inseridos em uma tabela. Atrav�s desta coluna podemos encontrar o n�mero sequencial de inser��es realizadas;

...

Quer ler esse conteúdo completo? Tenha acesso completo