Modelos de recupera��o de Backup de logs de transa��o no SQL Server

Ao escolhermos um modelo de recupera��o, precisamos primeiramente identificar suas necessidades de neg�cios, ou seja, registrarmos o consumo de espa�o, op��es de restaura��o para o banco de dados, a simplicidade referente ao planejamento de recupera��o de desastres, dentre outros pontos importantes. Em geral, os registros de manuten��o e backup s�o conceitos-chave que diferenciam estes modelos.

Trabalhando no modo simples

No modelo de recupera��o simples, o �nico objetivo do log de transa��es � garantir as propriedades ACID de transa��es para refor�ar a consist�ncia do banco de dados e sua durabilidade durante as opera��es de recupera��o de banco de dados. Neste modelo temos o impasse de que o log de transa��es n�o pode ser copiado e utilizado para as restaura��es de banco de dados nem para o envio de log. Aqui o que ocorre com o SQL Server � que ele executa automaticamente a transa��o de truncamento do log quando um checkpoint de transa��es � alcan�ado.

Todas as transa��es realizadas neste processo ainda s�o registradas, embora certas opera��es em massa s�o minimamente conectadas, o n�vel aplicado de registros aqui � muito semelhante ao aplicado no modo BULK_LOGGED, onde a parte ativa do log � mantida como normal, de modo que sempre que um banco de dados em modo de reinicializa��o simples, o processo de recupera��o ser� processado e os arquivos de dados ser�o conciliados com o conte�do do log de transa��es. No entanto, neste modelo todos os arquivos de log virtuais (nossos VLF�s) s�o marcados como inativos (podem ser recuperados), pois estes s�o automaticamente truncados durante os checkpoints de banco de dados regulares. Isto significa que qualquer VLF onde o LSN mais alto nesse ficheiro seja menor do que o MinLSN que ser� truncado, quando ocorrer um checkpoint. Como resultado, o espa�o no log de transa��es � regularmente e rotineiramente reutilizado.

Isto se d� devido a necessidade de recuperarmos o espa�o de log e, assim, mantermos o consumo de espa�o de log no m�nimo poss�vel. Quando todas as transa��es forem conclu�das e os dados forem gravados no banco de dados SQL, o log ser� truncado e o espa�o utilizado por esta transa��o poder� ser reutilizado por novas transa��es. Como neste caso n�o haver� nenhuma informa��o no log de transa��es, podemos restaurar o banco de dados para um ponto espec�fico na linha de tempo e restaur�-lo, por exemplo, para um momento em que voc� tomou um backup completo ou diferencial, dessa forma, as altera��es realizadas desde o �ltimo backup completo ou o diferencial n�o poder�o ser restaurados.

Precisamos utilizar os modelos simples para restaura��o quando:

For mais f�cil que recriar os dados ou mesmo refazer as altera��es desde o �ltimo backup realizado;
A perda de opera��es desde o �ltimo backup se torna aceit�vel.
Nossos dados n�o estiverem sujeitos a mudan�as frequentes.

Qual a frequ�ncia de ocorr�ncia de checkpoints?

Sabemos que s�o realizados checkpoints durante os processos existentes no banco de dados, mas com qual frequ�ncia isso pode acontecer? Bem, o pr�prio core do SQL Server que toma a decis�o com rela��o a frequ�ncia com a qual ser� executado um checkpoint, isto, baseado na quantidade de registros de log que ser�o necess�rios para a realiza��o dos processamentos necess�rios para a recupera��o de um banco de dados no tempo especificado pela op��o de configura��o de servidor. No caso de nosso banco de dados ser apenas para leitura, principalmente, o tempo entre os pontos de verifica��o podem ser longo. No entanto, em sistemas em produ��o onde os dados s�o atualizados constantemente, os checkpoints podem ocorrer a cada minuto.

Quando estamos em modo de recupera��o total do log de transa��es, este mant�m uma "hist�ria de transa��es inativas/fechadas", juntamente com os abertos/ativos. Esta "hist�ria" pode ser capturada em um backup do log e ser usada para a restaura��o do banco de dados para um ponto anterior no tempo, antes de uma quebra. No entanto, no modo SIMPLE (ou simples), estas hist�rias n�o existem e devido a isso, o registro n�o pode ser usado para restaura��o do banco de dados. Na Listagem 1 temos um exemplo pr�tico sobre essa restri��o da qual estamos tratando para melhorar o entendimento sobre esse modelo.

Listagem 1. Tentativa de backup em modo Simple.


  USE master;
    ALTER DATABASE TestDB
    SET RECOVERY SIMPLE;
    BACKUP Log TestDB
      TO DISK ='C:\Backups\TestDB_log.bak'
      GO

Quando executamos este script, o resultado que nos � retornado � um erro de acordo com a Figura 1, pois como j� explicado, este tipo de recupera��o ocorre apenas nos outros modelos.

Figura 1. Resultado referente ao script da Listagem 1.

Trabalhando no modo FULL (completo)

No modelo de recupera��o completa as opera��es dentro do log de transa��es s�o mantidos, a menos que o backup do log de transa��o ou o truncamento seja feito. Aqui, podemos realizar backups completos ou diferenciais juntamente com backups do log de transa��es (diferenciando do modo simples). Isso pode ocorrer, desde que possamos manter o controle de todas as transa��es que ocorram no banco de dados. Assim, podemos fazer pontos no tempo de recupera��o. No caso de um erro ser relatado e a transa��o n�o puder ser conclu�da, podemos reverter o banco de dados para um ponto antes desta opera��o e deix�-lo funcionando novamente. Normalmente, um banco de dados ser� definido com o modelo de recupera��o FULL quando os dados que o consistem forem cr�ticos ou mesmo quando estivermos usando o banco de dados de espelhamento. A fim de definirmos o banco de dados para "recupera��o completa" usando o SQL Server Management Studio, devemos seguir alguns passos, os quais seguem abaixo:

Primeiramente, clique com o bot�o direito do mouse sobre o banco de dados que estiver em uso e, em seguida, clique em "Propriedades";
Busque pela op��o 'Op��es' e clique nela;
Escolha a op��o "Full" para o modelo de recupera��o e clique em "OK" para que as altera��es sejam salvas.

No modo de recupera��o completa, apenas um backup do log pode causar truncamento, como tal, o log de transa��es realizar� um registro completo das opera��es realizadas desde a �ltima vez que o log de transa��es realizou um backup. Uma vez que todas as opera��es forem totalmente conectadas, o arquivo de log poder� crescer, muito rapidamente, em sistemas encontrados em produ��o. Portanto, quando trabalhamos em modo de recupera��o completa, � de vital import�ncia que fa�amos backups do log de transa��es regularmente, al�m de backups completos e, opcionalmente, backups diferenciais. O truncamento do log ocorre assim que o backup do log � feito, assumindo que um checkpoint ocorreu desde o �ltimo backup e que haja outros fatores que est�o atrasando o truncamento, como um backup de dados ou opera��o de restaura��o.

N�o � poss�vel realizarmos um backup do log de transa��es sem que ao menos o primeiro backup tenha sido realizado. Na verdade, se tivermos um banco de dados que esteja em modo de recupera��o completa, mas que nunca foi feito um backup, ent�o ele realmente n�o trabalhar� em modo de recupera��o completa. O banco de dados estar� ainda no modo de auto truncado at� que o primeiro backup completo seja executado.

Todos os backups de banco de dados, completo, log ou de outra forma, s�o realizados utilizando o comando BACKUP. O comando para executar um backup completo para o disco � apresentado de acordo com a Listagem 2.

Listagem 2. Script para cria��o de backups.

BACKUP DATABASE DatabaseNameTO DISK ='FileLocation\DatabaseName.bak';

Se este fosse o primeiro backup a ser executado, o arquivo DatabaseName.bak seria criado no diret�rio especificado. Se esse arquivo j� existir, ent�o o comportamento padr�o � acrescentar backups subsequentes a este arquivo. Para substituirmos este comportamento e estipularmos que qualquer arquivo existente deve ser sobrescrito, podemos usar a op��o INIT, da mesma forma como � apresentada pela Listagem 3. Mas o que normalmente acontece � que cada backup subsequente recebe um nome �nico.

Listagem 3. Script para substitui��o de backups.

BACKUP DATABASE DatabaseNameTO DISK ='FileLocation\DatabaseName.bak'WITH INIT;

� evidente que o backup de dados e arquivos de log n�o devem ser armazenados na mesma unidade que estiver hospedando os arquivos correntes. Devido ao fato de que se essa unidade sofrer uma falha de hardware, ent�o todas as suas c�pias ser�o perdidas junto com os arquivos em execu��o, os backups n�o ter�o nenhuma valia. Os arquivos devem ser copiados em dispositivos separados, ou mesmo, o backup ser realizado numa unidade local, espelhado.

Com que frequ�ncia devemos criar backups no modo FULL?

O que seria mesmo o esquema de backup, se n�o um compromisso entre o idealizado e a pr�tica, entre a avalia��o do verdadeiro risco de perda de dados, e qual ser� o custo da empresa e os custos envolvidos na mitiga��o desse risco? A frequ�ncia de cria��o de backups do log pode ser ditada pelo n�mero de transa��es em que o banco de dados est� sujeito. Para bancos de dados muito requisitados, pode ser necess�rio fazer o backup com maior frequ�ncia, a fim de controlar o tamanho do log.

N�o h�, no entanto, uma maneira simples de calcularmos quantas vezes ser�o feitos os backups de log. A maioria dos DBAs tem sua melhor estimativa em como frequentemente os logs de backups devem ser tomados, a partir disso, observam as caracter�sticas de crescimento dos arquivos e, em seguida, ajustam o esquema de backup que for necess�rio para evitar que eles fiquem com grandes dimens�es.

Cadeia de logs

N�o � poss�vel realizar um backup do log de transa��es sem primeiro termos, pelo menos, um backup completo. Para recuperarmos um banco de dados para um determinado ponto no tempo, ou ao fim de um backup de log espec�fico ou mesmo para um ponto no tempo dentro de um backup do log em particular, deve existir uma cadeia ininterrupta cheia de registros de log, certo? Isso acontece a partir do primeiro backup de log realizado ap�s um backup completo (ou um backup diferencial), at� o ponto de falha. Esta � conhecida como cadeia de log.

H� diversas maneiras de se quebrar uma cadeia de logs, e se o fizermos isso significa que s� seremos capazes de recuperar o banco de dados para o tempo do backup de log antes do acontecimento que quebrou esta cadeia. Resumidamente, quebrar uma cadeia de logs n�o � uma boa ideia, caso estejamos preocupados com a capacidade de restaura��o de nossos dados. Estaremos apresentando duas das formas mais comuns para quebrar uma cadeia, as quais s�o as seguintes:

Perda ou corrup��o de um arquivo de backup do log de transa��es � neste caso, apenas poderemos recuperar o �ltimo backup do log anterior que esteja �utiliz�vel�. Com isso, a cadeia de logs come�ar� novamente no pr�ximo backup completo ou diferencial em condi��es aceit�veis para tal.
Alternar para o modo de recupera��o simples � aqui, caso tenhamos a inten��o de mudar de um modo de recupera��o FULL para o modo de recupera��o simples, isso ir� quebrar a cadeia de logs como um checkpoint ser� instigado e o log de transa��es poder� ser imediatamente truncado. Caso volte para o modo FULL, teremos que ter um outro backup completo para a reinicializa��o da cadeia de log. De fato, at� tomarmos esse backup completo, o banco de dados permanecer� no modo de auto truncado e com isso, n�o seremos capazes de fazer o backup do arquivo de log.

Em vers�es anteriores ao SQL Server 2008, havia um par de comandos, ou seja, BACKUP LOG com o no_log ou o BACKUP LOG WITH TRUNCATE_ONLY, que s�o equivalentes funcionalmente ao que temos hoje, que, quando emitidos, for�ariam um truncamento do arquivo de log e assim quebrariam a cadeia de logs. De qualquer forma, n�o devemos emitir esses comandos em nenhuma vers�o do SQL Server, mas estamos mencionando aqui apenas a t�tulo de conhecimento, pois ao tentarmos lidar com um "arquivo de log ", sem a devida compreens�o as implica��es que temos para a sua capacidade de restaura��o do nosso banco de dados n�o ser�o alcan�adas.

Trabalhando no modo BULK_LOGGED

Este t�tulo, de certa forma, pode ser um pouco enganador, uma vez que n�o seria geralmente um gerenciamento de registro, de qualquer forma a longo prazo, quando operarmos um banco de dados no modelo de recupera��o BULK_LOGGED. No entanto, um DBA pode considerar a mudan�a de um banco de dados para o modelo de recupera��o BULK_LOGGED durante um curto espa�o de tempo, por exemplo, opera��es de cargas em massa. Quando um banco de dados est� operando no modelo BULK_LOGGED estas, e algumas outras opera��es, tais como �ndice de recria��o, podem ser minimamente registradas e, portanto, ir�o usar menos espa�o no log. Ao reconstruirmos o �ndice agrupado para tabelas muito grandes, ou quando carregarmos milh�es de linhas de dados, a redu��o no uso de espa�o em log quando operando no modo de recupera��o BULK_LOGGED, em compara��o com o modelo de recupera��o completa, pode ser muito mais elevado.

Mesmo assim, devemos usar a recupera��o BULK_LOGGED apenas com pleno conhecimento das implica��es que tem para banco de dados de restaura��o e recupera��o. Por exemplo, n�o � poss�vel restaurarmos a um ponto espec�fico no tempo dentro de um backup de log que contenham registros de log relativos a opera��es minimamente registradas. Al�m disso, h� um caso em especial no qual um backup do log de �tail� falhar�, onde as opera��es minimamente registradas, que foram gravadas durante um processo do banco de dados operando em modelo de recupera��o BULK_LOGGED, existam na parte ativa do log de transa��es e um arquivo de dados tornar-se indispon�vel, como resultado de uma falha grave.

Em caso de estarmos sem sorte e algo do tipo ocorrer, ent�o qualquer uma destas limita��es pode levar a perda de dados importantes. � bom verificarmos o Acordo de N�vel de Servi�o (SLA) para o banco de dados em quest�o, para n�veis aceit�veis de perda de dados; se ele expressar que a toler�ncia � zero, ent�o � altamente improv�vel que o uso do modelo BULK_LOGGED, mesmo por curtos per�odos, ser� aceit�vel. Por outro lado, � claro, se essa base de dados estiverem sujeita a �ndices regulares de reconstru��o ou de cargas, em seguida, os propriet�rios do banco de dados devam compreender as implica��es para a aloca��o de espa�o de log desse banco de dados, de realizar estas opera��es sob o modelo de recupera��o completa.

Dito tudo isto, para muitos bancos de dados, a capacidade de alternar para a recupera��o BULK_LOGGED para que o SQL Server minimizar� determinadas opera��es de log, o que o torna uma arma muito �til na batalha contra o crescimento excessivo do log. Na maioria dos casos, o SLA vai permitir uma margem de manobra suficiente para fazer o seu uso aceit�vel e, com planejamento e procedimentos de cuidado, os riscos ser�o m�nimos.

Com isso finalizamos este artigo, onde demos uma no��o geral com rela��o aos modelos de recupera��o de banco de dados, o que n�o quer dizer que � suficiente para uma compreens�o pr�tica, mas de forma te�rica, j� demos um grande avan�o por aqui. Trataremos com rela��o aos modelos de recupera��o FULL e BUL_LOGGED na pr�tica nos pr�ximos artigos. No entanto, mostramos como podemos criar arquivos de backup e mostramos de forma simplificada o que acontece quando tentamos realizar recupera��es de banco de dados em modo simples.

Links

Checkpoints
http://msdn.microsoft.com/en-gb/library/ms189573.aspx

Truncamento de VLF�s recuper�veis
http://msdn.microsoft.com/en-gb/library/ms345414.aspx

Comando BACKUP
http://msdn.microsoft.com/en-us/library/ms186865.aspx