SQL Transactions: Gerenciando logs de transa��o do SQL Server

Neste artigo estaremos interessados em fazer um estudo com rela��o ao gerenciamento dos logs de transa��o, os quais s�o muito �teis em tempos dif�ceis que podemos ter com o mal funcionamento de nossas bases de dados. Teremos ent�o uma vis�o geral sendo apresentada nesse momento e posteriormente abordaremos pontos mais precisos com rela��o a utiliza��o dos logs para que possamos ter a compreens�o correta na hora em precisarmos utiliz�-los.

Uma abordagem geral sobre os logs de transa��o

Podemos entender por logs de transa��o sendo este um arquivo no qual o SQL Server armazena um registro com todas as transa��es realizadas e dados que foram modificados no banco de dados com o qual o arquivo de log possa estar associado. Isso � bem necess�rio para que em casos que o SQL Server seja desligado inesperadamente, como uma falha da inst�ncia ou mesmo hardware, o log de transa��o � utilizado para recuperar o banco de dados, com a integridade dos dados. Ap�s o rein�cio, um banco de dados entra em um processo de recupera��o em que o log de transa��o � lido para garantir que todos os dados sejam v�lidos, onde os dados comitados ser�o escritos nos arquivos de dados, j� em casos em que quaisquer transa��es n�o sejam parciais, estas s�o desfeitas (realiza��o de rollbacks). Em suma, o log de transa��o � o meio fundamental pelo qual o SQL Server garante a integridade da base de dados e as propriedades ACID de transa��es. No papel de DBA, temos algumas tarefas importantes quanto a gest�o de logs de transa��o, sendo estes os seguintes:

A escolha de um modelo de recupera��o correto � O SQL Server oferece tr�s modelos de recupera��o de banco de dados, que s�o: o FULL (como padr�o), simples e em massa registrada (Bulked Logged). O DBA, no entanto, deve escolher o modelo adequado de acordo com os requisitos de neg�cio para o banco de dados e, em seguida, estabelecer procedimentos de manuten��o adequados.
Fazer backups do log de transa��o � � de vital import�ncia que o DBA realize backups regulares do log de transa��o. Uma vez capturado em um arquivo de backup, os registros podem ser posteriormente aplicados a um backup de banco de dados completo, a fim de executar uma restaura��o do banco de dados, e assim recriar o banco de dados como ele existia em um ponto anterior no tempo, como por exemplo, antes de uma falha.
Monitorar e gerenciar o crescimento de registro - Em um banco de dados o log de transa��o pode crescer rapidamente. Se n�o for feito um backup regularmente, ou se as caracter�sticas de crescimento forem incorretas ou inadequadas para o porte, o arquivo de log de transa��o pode �encher�, levando ao erro "9002" (que � um log de transa��o completo), o que coloca o SQL Server em um modo de "somente leitura" (ou em modo de "recurso pendente", se isso acontecer durante a recupera��o).
Otimizar a transfer�ncia de registro - Al�m da manuten��o b�sica, como fazer backups, o DBA deve tomar medidas para garantir o desempenho adequado do log de transa��o. Isto inclui considera��es de hardware, bem como evitar situa��o como a fragmenta��o de registros, o que pode afetar o desempenho das transa��es.

Neste artigo, estaremos considerando cada uma destas tarefas de manuten��o em detalhes. No nosso primeiro momento, come�aremos com uma vis�o geral de como o SQL Server usa o log de transa��o, e duas das formas mais significativas de impactos na vida de um DBA, ou seja, a restaura��o e a recupera��o de banco de dados e gerenciamento de espa�o em disco.

Logs de transa��o e SQL Server

No SQL Server, o log de transa��o � um arquivo f�sico, identificado convencionalmente, embora n�o obrigatoriamente, pela extens�o FDL. Ele � criado automaticamente na cria��o de um banco de dados, juntamente com o arquivo de dados principal, comumente identificado pela extens�o de MDF, que armazena os objetos de banco de dados e os dados em si. O log de transa��o, enquanto ele � implementado como um �nico arquivo f�sico geralmente, ele tamb�m pode ser implementado como sendo um conjunto de arquivos. No entanto, mesmo neste �ltimo caso, ainda � tratado pelo SQL Server como um �nico arquivo de forma sequencial e, como tal, o SQL Server n�o pode e n�o escreve em paralelo com v�rios arquivos de log, e por isso n�o h� vantagem com rela��o a desempenho que possa ser tido a partir da implementa��o do log de transa��o com v�rios arquivos.

Sempre que � realizada uma altera��o com o c�digo T-SQL em um objeto de banco de dados (DDL), ou mesmo, os dados que ele cont�m, n�o s�o s� os dados ou objeto que s�o atualizados no arquivo de dados, mas tamb�m os detalhes da mudan�a que s�o registrados como um registro de log na transa��o log. Cada registro de log cont�m detalhes sobre o ID da transa��o que fez a mudan�a, quando essa opera��o come�ou e quando ela terminou, quais p�ginas foram alteradas, as altera��es de dados que foram feitas, dentre outras informa��es relevantes. O que precisamos entender tamb�m � que o log de transa��o n�o � uma trilha de auditoria. Ele n�o fornece uma trilha de auditoria das altera��es feitas ao banco de dados, n�o mant�m um registro dos comandos que foram executados no banco de dados, assim como os dados alterados como resultado.

Quando uma modifica��o de dados � feita, as p�ginas de dados relevantes s�o lidas a partir do cache de dados, ou ser�o recuperados primeiro do disco caso eles n�o estejam no cache. Os dados s�o modificados no cache de dados, e os registros de log para descrever os efeitos da opera��o s�o criados no cache de log. Quando uma transa��o � confirmada, os registros de log s�o gravados no log de transa��o, no disco. No entanto, os dados que foram alterados n�o podem ser gravados no disco at� que ocorra o checkpoint do banco de dados. Qualquer p�gina em cache que foi modificada desde a sua leitura a partir do disco de modo que o valor dos dados em cache seja diferente do que est� no disco � chamada de �p�gina suja�. Estas p�ginas sujas podem conter os dados que foram comprometidos para o arquivo de log de transa��o, mas ainda n�o para o arquivo de dados e os dados modificados por opera��es abertas, ou seja, aqueles que ainda n�o tenham sido cometidos (ou revertida (roolback)).

Os checkpoints da base de dados realizam um scaneamento do cache e liberam todas as �p�ginas sujas� do disco, neste momento, as modifica��es s�o refletidas no arquivo de dados f�sico, bem como no arquivo de log. Isso acontece mesmo nos casos em que a transa��o ainda est� aberta. Durante um checkpoint, as p�ginas sujas relacionadas para abrir as transa��es s�o liberadas para o disco, o SQL Server sempre assegura que os registros de log referentes a essas transa��es abertas sejam liberados a partir do cache de log para o arquivo de log de transa��o antes que as p�ginas sujas sejam liberadas para os arquivos de dados. Outro processo que verifica o cache de dados, � o LazyWriter, que tamb�m pode escrever p�ginas de dados no disco, de fora de um checkpoint, se for�ado a faz�-lo por press�es de mem�ria.

O ponto importante que devemos observar aqui � que o gerenciador de log de buffer sempre garante que as descri��es de mudan�a (registros de log) sejam escritas no log de transa��o, no disco, antes de as p�ginas de dados serem escritas para os arquivos de dados f�sicos. Este mecanismo � denominado log (ou registro) de write-ahead. � essencialmente o mecanismo pelo qual o SQL Server garante durabilidade em suas transa��es.

Devido ao fato de sempre escrever as altera��es no arquivo de log em primeiro lugar, o SQL Server tem a base de um mecanismo que possa garantir que os efeitos de todas as transa��es confirmadas sejam ent�o refletidos nos arquivos de dados, e que qualquer modifica��o de dados no disco que se originar de transa��es incompletas, ou seja, aqueles para os quais nem um COMMIT ou um ROLLBACK foram emitidos em �ltima an�lise, n�o ser�o refletidos nos arquivos de dados.

Se um banco de dados quebra, por exemplo, depois de uma transa��o (T1) ser comprometida, mas antes de os dados afetados serem escritos para o arquivo de dados, em seguida, durante a reinicializa��o, o processo de recupera��o de banco de dados � iniciado, que tenta conciliar o conte�do das opera��es de arquivo de log e os arquivos de dados. Ele ir� ler o arquivo de log de transa��o e garantir que todas as opera��es que comp�em a transa��o T1, registrada no arquivo de log, seja refeito para que sejam refletidas nos arquivos de dados.

Da mesma forma, ap�s uma quebra do banco de dados, o processo de recupera��o ir� "reverter" (desfazer) quaisquer altera��es de dados no banco de dados que est�o associados a transa��es n�o confirmadas, lendo as opera��es relevantes do arquivo de log e executar a opera��o inversa f�sica sobre os dados. Desta forma, o SQL Server pode retornar o banco de dados para um estado consistente. De modo mais geral, o processo de revers�o (desfazer) ocorre da seguinte forma:

Um comando ROLLBACK � emitido para uma transa��o expl�cita
Um erro ocorre e o XACT_ABORT ser� ligado
Se o banco de dados detectar que a comunica��o foi interrompida entre o banco de dados e o cliente que iniciou as transa��es.

Em tais circunst�ncias, os registros referentes a uma transa��o interrompida, ou aquele para o qual o comando ROLLBACK � explicitamente emitido, s�o lidas e as mudan�as s�o revertidas. Dessa forma, o SQL Server garante que todas as a��es associadas a uma opera��o de sucesso, como uma unidade, ou que todos eles falham. Como tal, o log de transa��o representa um dos meios fundamentais pelos quais o SQL Server garante a consist�ncia e integridade dos dados durante a opera��o normal do dia a dia.

No entanto, o log de transa��o desempenha um outro papel, o papel vital na medida em que fornece o mecanismo pelo qual o banco de dados pode ser restaurado para um ponto anterior no tempo, em caso de uma quebra. Com planejamento e gest�o adequados, podemos usar backups destes arquivos de log para restaurar todos os nossos dados onde eles se tornaram danificados ou inutiliz�veis.

Log de transa��o do banco de dados e restaura��o

Como dito anteriormente, um arquivo de log de transa��o armazena uma s�rie de registros de logs, sequencial de acordo com quando a transa��o come�ou, que dessa forma, fornecem um registro hist�rico das modifica��es e opera��es que tenham sido emitidas contra esse banco de dados. Cada registro de log cont�m detalhes sobre o ID da transa��o que fez a mudan�a, quando essa opera��o come�ou e terminou, quais p�ginas foram alteradas, as altera��es de dados que foram feitas, e assim por diante. Os registros de log no arquivo de log de transa��o s�o organizados em v�rias se��es, que s�o chamadas de Virtual Log Files (VLF).

O Mecanismo de log write-ahead do SQL Server garante que a descri��o de uma modifica��o (ou seja, o registro de log) seja gravada em um VLF antes que os dados modificados sejam escritos para o arquivo de dados. Assim, um registro de log pode conter detalhes de uma transa��o fechada (ou seja, comitada) ou uma transa��o aberta (n�o comitada), e em cada caso, os dados modificados pela transa��o podem ou n�o podem ter sido escritos para os arquivos de dados, dependendo de onde ocorreu um checkpoint ou n�o. O processo de verifica��o de banco de dados controla a quantidade de trabalho que o SQL Server precisa fazer durante uma opera��o de recupera��o de banco de dados. Se o SQL Server teve que dar continuidade as mudan�as para um enorme n�mero de transa��es comitadas relacionadas com p�ginas sujas, ent�o o processo de recupera��o poder� ser muito mais demorado.

Qualquer registro de log referente a uma transa��o aberta pode ser necess�rio para uma opera��o de revers�o, durante a recupera��o, e sempre vai ser uma parte do que � chamado de um VLF ativo e devido a isso, sempre ser� retido no arquivo de log. Um registro de log referente a uma transa��o fechada tamb�m ser� parte de um VLF ativa, at� atingir o ponto em que n�o h� registros de log em todo o VLF que esteja associado com uma transa��o aberta, onde o VLF passa a ser inativo.

Os registros de log contidos nessas VLF inativas essencialmente fornecem um "hist�rico" das transa��es de banco de dados previamente preenchidas, e o que acontece com essas VLFs inativas varia de acordo com o modelo de recupera��o do banco de dados. Como exemplo, podemos citar que se estivermos usando a forma total do modelo de recupera��o de banco de dados (ou BULK Logged), ent�o o log de transa��o mant�m os registros de log em VLF inativos, at� que um backup do log seja tomado, o que trataremos posteriormente.

Ao fazer o backup do log de transa��o, podemos ent�o capturar em um arquivo de backup todos os registros de log no log no momento da execu��o, incluindo os dessas VLFs inativas. Esses backups do log podem ser usados para restaurar o banco de dados para um ponto no tempo anterior; o que para n�s seria muito melhor se ocorresse pr�ximo a um ponto no tempo muito pr�ximo do ponto em que as quebras ocorreram. No caso de uma quebra, os arquivos de backup de log podem ser aplicados a uma c�pia restaurada de um arquivo de backup de banco de dados completo, e todas as transa��es que ocorreram ap�s o backup completo ser�o executadas, durante a recupera��o do banco de dados, para recuperar o banco de dados e restaurar os dados para um determinado ponto no tempo, e assim minimizarmos qualquer perda de dados. Naturalmente, isso pressup�e que n�o tenhamos apenas tomado esses backups de log, mas tamb�m que os transferimos para locais seguros. Se os seus arquivos de backup do log est�o na mesma unidade que o arquivo de registro, consequentemente onde tem as falhas no disco, ent�o podemos perder todos os nossos backups, e estaremos perdidos!

Quando um banco de dados est� no modelo de recupera��o simples, os registros de log existentes nos VLF ativos s�o mantidos, uma vez que podem ser necess�rios para uma opera��o de revers�o (Rollback). No entanto, os VLF inativos ser�o truncados quando um checkpoint ocorrer, o que significa que os registros de log nessas VLF podem ser imediatamente substitu�dos por novos registros de log. � por isso que um banco de dados operando em recupera��o simples � referido como estando em modo de auto truncado. Neste modo, nenhuma descri��o de fatos passados � mantida no registro e por isso n�o pode ser capturada em um backup do log e usada como parte do processo de restaura��o.

Controlando o tamanho do arquivo de log

De acordo com o ponto anterior, podemos ter certeza ent�o de que precisamos manter sempre um backup atualizado e seguro para casos de emerg�ncia. No entanto, h� uma segunda raz�o importante a se tomar com rela��o a esses backups do log quando estiverem operando em sua totalidade (ou em BULK_LOGGED) que � o controle do tamanho do log. Lembrem-se que um registro de log � gravado no arquivo de log para cada transa��o que modifica os dados ou objetos em um banco de dados SQL Server. Em um sistema, com muitas transa��es simult�neas, ou aqueles que escrevem um monte de dados, o log de transa��o pode crescer em tamanho muito rapidamente.

Quando trabalhamos em modo full (ou BULK_LOGGED), a captura em um arquivo de backup de uma c�pia dos registros de log em VLF inativas, � a �nica a��o que vai fazer essas VLFs eleg�veis para um truncamento, o que significa que o espa�o ocupado pelos registros de log se tornam dispon�veis para reutiliza��o.

Algo que � necess�rio saber com rela��o ao truncamento e ao tamanho dos logs de transa��o � que h� um mal entendido comum que diz que truncar o arquivo de log significa que os registros de log s�o exclu�dos e o arquivo diminui de tamanho... Ele n�o � assim. O truncamento de um arquivo de log � simplesmente o ato de marcar o espa�o como dispon�vel para reutiliza��o. Portanto, uma das raz�es por que � vital para execu��o de backups do log de transa��o regulares ao se trabalhar em modo full (ou BULK_LOGGED) � manter o controle com rela��o ao tamanho do log. Agora vamos a um exemplo pr�tico para come�armos a entender o processo de logs de transa��o.

Um breve exemplo de fazer o backup do log de transa��o

A fim de apresentarmos uma forma breve com rela��o a alguns dos conceitos que discutimos neste artigo, ser� feito um exemplo muito simples de como fazer backup do log de transa��o para um banco de dados operando em modo de recupera��o total. Iremos ent�o criar uma nova base de dados chamada de TesteDB, utilizando o SQL Server 2014, mas podem utilizar outras vers�es, em seguida, obteremos o tamanho do arquivo de log inicial usando o comando SQLPERF (LOGSPACE). O c�digo ser� disposto como o apresentado pela Listagem 1.

Listagem 1. Tamanho do arquivo de Log inicial para a tabela de testes criada.


      USE master ;
      IF EXISTS ( SELECT  name
                  FROM    sys.databases
                  WHERE   name = 'TesteDB' ) 
          DROP DATABASE TesteDB ;
      CREATE DATABASE TesteDB ON
      (
        NAME = TesteDB_dat,
        FILENAME = 'C:\Program Files\Microsoft SQL Server\MSSQL12.MSSQLSERVER\MSSQL\DATA\TesteDB.mdf'
      ) LOG ON
      (
        NAME = TesteDB_log,
        FILENAME = 'C:\Program Files\Microsoft SQL Server\MSSQL12.MSSQLSERVER\MSSQL\DATA\TesteDB.ldf'
      ) ;
      DBCC SQLPERF(LOGSPACE);

Como voc�s podem ver, o arquivo de log tem aproximadamente 1 MB de tamanho, e cerca de 30% completo, como apresentado pela Figura 1. N�o esque�am de mudar os filenames para o caminho existente em sua m�quina, pois caso contr�rio n�o ir� funcionar. As caracter�sticas iniciais de tamanho e crescimento dos bancos de dados do usu�rio criados em uma inst�ncia s�o determinadas pelas propriedades do banco de dados do modelo, como � o modelo de recupera��o padr�o que cada banco de dados ir� utilizar (no nosso caso, o FULL).

Tamanho do
arquivo de log TesteDB

Figura 1. Tamanho do arquivo de log TesteDB.

Agora que temos nosso arquivo criado, vamos fazer um backup do arquivo de dados para TesteDB, como mostrado pela Listagem 2, para isso, criaremos primeiro o diret�rio "backups" na unidade C. Notem aqui que esta opera��o de backup garante que o banco de dados realmente est� operando em modo de recupera��o total.

Listagem 2. Cria��o da pasta de backups para a realiza��o do backup.

-- backup completo da base de dados
      BACKUP DATABASE TesteDB
      TO DISK ='C:\Backups\TesteDB.bak'
      WITH INIT;
      GO

At� o momento n�o h� nenhuma mudan�a no tamanho dos dados ou no arquivo de log, como resultado desta opera��o de backup ou mesmo na porcentagem de espa�o de log utilizado, o que talvez n�o seja surpresa dado que n�o h� tabelas de usu�rio ou dados no banco de dados ainda. Vamos ent�o criar uma tabela chamada LogTeste no banco de dados, preench�-lo com 500 mil registros, e reavaliar o tamanho do arquivo de log, como mostrado na Listagem 3. N�o h� a necessidade de nos preocuparmos no momento com os detalhes do c�digo.

Listagem 3. Cria��o do script para gera��o de registros.

USE TesteDB ;
      GO
      IF OBJECT_ID('dbo.LogTeste', 'U') IS NOT NULL 
          DROP TABLE dbo.LogTeste;
      -- "ID" possui um range def 1 at� 500000 de numeros unicos
      -- "Inteiros" possui um range def 1 at� 50000 de numeros n�o unicos
      -- "texto";"AA"-"ZZ" string de 2 caracteres
      -- "dinheiro"; 0.0000 to 99.9999 valores monet�rios
      -- "Date" ; >=01/01/2000 and <01/01/2010 datas.
       
      SELECT TOP 500000
              ID = IDENTITY( INT,1,1 ),
              Inteiros = ABS(CHECKSUM(NEWID())) % 50000 + 1 ,
              texto = CHAR(ABS(CHECKSUM(NEWID())) % 26 + 65)
              + CHAR(ABS(CHECKSUM(NEWID())) % 26 + 65) ,
              dinheiro = CAST(ABS(CHECKSUM(NEWID())) % 10000 / 100.0 AS MONEY) ,
              Date = CAST(RAND(CHECKSUM(NEWID())) * 3653.0 + 36524.0 AS DATETIME)
      INTO    dbo.LogTeste
      FROM    sys.all_columns ac1
              CROSS JOIN sys.all_columns ac2 ;
      DBCC SQLPERF(LOGSPACE);

Observem aqui que o tamanho do arquivo de log cresceu consideravelmente, como apresentado pela Figura 2, para quase 20MB e o registro � de 99% completo (os n�meros podem ser ligeiramente diferentes em seu sistema). Se f�ssemos inserir mais dados, ele teria que crescer em tamanho novamente para acomodar mais registros de log.

Figura 2. Registro de log alterado.

Caso tenham interesse, rodem novamente o script apresentado pela Listagem 2, para fazer o backup do arquivo de dados novamente, e isso n�o far� diferen�a para o tamanho do arquivo de log, ou a porcentagem de espa�o usado no arquivo. Agora, por�m, vamos fazer um backup do arquivo de log de transa��o e verificar novamente os valores, como mostrado pela Listagem 4.

Listagem 4. Backup dos arquivos.

BACKUP Log TesteDB
      TO DISK ='C:\Backups\TesteDB_log.bak'
      WITH INIT;
      GO
      DBCC SQLPERF(LOGSPACE);

O arquivo de log ainda � o mesmo tamanho f�sico, mas por fazer o backup do arquivo, o SQL Server � capaz de truncar o log, tornando o espa�o nas VLF "inativos" no arquivo de log dispon�vel para reutiliza��o; mais registros de log podem ser adicionados sem a necessidade de crescer fisicamente o arquivo. Al�m disso, � claro, n�s capturamos os registros de log em um arquivo de backup e assim seriamos capazes de us�-los como parte do processo de recupera��o de banco de dados, devemos ent�o precisar restaurar o banco de dados TesteDB para um estado anterior.

Com isso finalizamos o nosso artigo, onde explanamos um pouco com rela��o ao gerenciamento de logs de transa��o, apresentando al�m de uma parte te�rica, um exemplo pr�tico para um melhor conhecimento com rela��o a como o SQL Server faz para manter a consist�ncia e a integridade dos dados, atrav�s de um mecanismo de log write-ahead. N�s tamb�m apresentamos como um DBA pode capturar o conte�do do arquivo de log de transa��o em um arquivo de backup, que pode ser reutilizado para restaurar o banco de dados como parte de um processo de recupera��o. Por fim, destacou-se a import�ncia de backups para controlar o tamanho do log de transa��o.