artigo SQL Magazine 11 - Um tradutor de Triggers

Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

Clique aqui para ler esse artigo em PDF.

Clique aqui para ler todos os artigos desta edi��o

Um Tradutor de Triggers

H� diversos motivos para que se queira portar triggers entre bancos de dados diferentes. Um motivo comum hoje em dia s�o as pol�ticas de consolida��o, centraliza��o, ou padroniza��o de SGBDs, em curso em diversas empresas e que imp�em a migra��o de um sistema feito em um BD para outro. Embora a migra��o do esquema e dos dados possa oferecer alguma dificuldade por conta dos tipos de campos e restri��es de integridade, j� existem ferramentas que auxiliam esta atividade, como por exemplo o IBDataPump (www.clevercomponents.com). No entanto, a migra��o dos triggers � quase sempre realizada de forma manual, sendo uma tarefa custosa e principalmente entediante, propensa portanto � introdu��o de bugs. Se este passo for automatizado, o custo de migra��o pode ser reduzido e, principalmente, a qualidade melhorada. Outras motiva��es para a migra��o s�o a atualiza��o de aplica��es que usam SGBDs que ca�ram em desuso, ou cujas licen�as se tornaram muito caras, ou ainda a migra��o para software livre.

Neste artigo apresentaremos uma solu��o automatizada para um problema muito comum na �rea de banco de dados: portar triggers entre sistemas gerenciadores de bancos de dados (SGBD). Mais precisamente, iremos mostrar como construir um programa tradutor que reescreva na linguagem do Firebird 1.5 (PSQL) triggers originalmente escritos em PL/SQL Oracle. A t�cnica a ser utilizada � a mesma empregada na constru��o de compiladores, e pode ser facilmente adaptada para outros SGBDs. No entanto, � exigido que o programador tenha um m�nimo de conhecimentos te�ricos sobre constru��o de compiladores (normalmente ensinado em qualquer curso de gradua��o em inform�tica). Faremos um breve apanhado da teoria necess�ria, mostrando o uso das ferramentas mais comuns dispon�veis: o lex e o yacc.

Lex e Yacc

O processo de um compilador ou interpretador de uma linguagem de programa��o � geralmente decomposto em 2 tarefas:

1) Ler o programa fonte e descobrir sua estrutura;

2) Processar sua estrutura para gerar o programa final.

O Lex e o Yacc podem ajudar na primeira tarefa que pode ser subdividida em mais 2 partes:

1) Dividir o c�digo em tokens (fun��o do Lex);

2) Descobrir a hierarquia da estrutura do programa (Yacc).

Lex e yacc s�o dois programas de linha de comando dispon�veis em quase todas as distribui��es do Unix e do Linux. O lex deve ser chamado recebendo como entrada um par�metro que � o nome do arquivo contendo os comandos a serem processados. Por exemplo:

$bash> lex entrada.l

A sa�da do lex ser� um programa em C (lex.yy.c) contendo rotinas que ser�o chamadas pelo nosso compilador.

O yacc deve ser chamado recebendo como par�metro o nome do arquivo que cont�m as regras de tradu��o para o nosso compilador, e produz como sa�da o c�digo source do compilador (y.tab.c). Esse c�digo fonte cont�m chamadas para as fun��es geradas pelo lex no arquivo lex.yy.c (dessa forma, um include � usado para referenciar o arquivo lex.yy.c). Depois basta usar o gcc para compilar o arquivo y.tab.c e assim gerar o execut�vel do nosso compilador.

O programa compilado gerado pelo yacc � um execut�vel que l� um arquivo na entrada padr�o e, atrav�s das regras de tradu��o especificadas, produz o arquivo compilado, ou seja, o c�digo traduzido, na sa�da padr�o.

Semelhan�as entre as linguagens

Para que seja poss�vel automatizar a tradu��o de um trigger de uma linguagem para outra � necess�rio que haja um m�nimo de compatibilidade entre suas estruturas. Linguagens que apresentem constru��es muito espec�ficas ir�o dificultar ou mesmo tornar invi�vel o mapeamento. Por sorte, as constru��es muito espec�ficas em geral n�o s�o muito utilizadas, o que torna o tradutor eficaz na maioria dos casos. Ou seja, podemos construir rapidamente um tradutor que trate a maioria dos triggers, e deixe uns poucos casos para serem manualmente traduzidos.

Um passo importante na hora de construir um tradutor desse tipo � decidir quais comandos e constru��es da linguagem ser�o tratados e quais ser�o deixados de fora. No nosso exemplo iremos construir um tradutor de triggers escritos em PL/SQL Oracle para a linguagem do Firebird 1.5 (uma vers�o melhorada da linguagem dispon�vel no Interbase 6.0 e no FB 1.0). Passemos a analisar agora as principais semelhan�as e diferen�as entre estas duas linguagens.

O primeiro ponto a ser analisado diz respeito aos eventos que ativam os triggers. Nesse quesito temos uma incompatibilidade dif�cil de ser superada: o Oracle possui um tipo especial de triggers, chamado de statement level (vide artigo de Stored Procedures e Triggers no Oracle publicado na SQL Magazine n� 4). N�o h� como criar diretamente um trigger equivalente no Firebird. No entanto, conforme afirmamos antes, isto n�o chega a ser um empecilho grave pois esse tipo de trigger raramente � utilizado. De resto, os triggers do Oracle s�o ativados pelos mesmos seis eventos que o Firebird: after ou before insert, after ou before update e after ou before delete, chamados uma vez para cada linha afetada na tabela.

Ainda sobre a ativa��o de um trigger, o Oracle permite definir que um trigger de update seja acionado somente se determinados campos forem alterados. � poss�vel tamb�m definir uma pr�-condi��o (cl�usula WHEN) para que um trigger seja acionado. Essas funcionalidades n�o est�o presentes no Firebird, mas veremos que � f�cil simul�-las com o uso de alguns comandos IF-THEN.

O segundo ponto diz respeito aos tipos de dados. Para os tipos b�sicos de dados n�o teremos muitos problemas, pois os tipos do Firebird s�o compat�veis com os do Oracle. J� para os cursores, arrays (vetores) e tabelas tempor�rias as semelhan�as ser�o suficientes para evitar solu��es complicadas, mas teremos de restringir um pouco a tradu��o nesse ponto.

No geral, embora haja diferen�as entre as linguagens analisadas, grande parte delas s�o diferen�as de sintaxe, ou seja, existem comandos com fun��es semelhantes mas com nomes ou constru��es diferentes em cada linguagem. Assim, ser� poss�vel construir um tradutor que ir� abranger a maioria dos triggers comumente implementados.

Revis�o: compiladores, gram�ticas, lex, yacc, atributos

Iremos agora fazer uma pequena revis�o pr�tica do processo de tradu��o e as principais ferramentas utilizadas � o lex e o yacc. Nosso ambiente de desenvolvimento foi o Linux Conectiva 7.0, Kernel 2.4 e gcc 2.95.3. O lex e o yacc s�o instalados por default nessa distribui��o.

Lex e yacc s�o ferramentas complementares para a constru��o de compiladores. Ambas possuem uma linguagem de programa��o pr�pria, que quando processada gera como sa�da um programa em C padr�o, que ao ser compilado pelo gcc gera um execut�vel � o nosso tradutor.

A t�cnica de constru��o de compiladores que iremos utilizar divide o compilador em tr�s etapas de an�lise e uma de s�ntese: an�lises l�xica, sint�tica e sem�ntica, e gera��o de c�digo. Por se tratar de um tradutor simples, n�o iremos abordar nenhum tipo de otimiza��o de c�digo nem representa��es intermedi�rias. O lex serve para construir analisadores l�xicos, e o yacc para construir analisadores sint�ticos. O analisador sem�ntico e a gera��o de c�digo ser�o manualmente escritos por n�s de uma forma predeterminada para ser integrada ao lex e ao yacc.

Gram�ticas

Para se construir um compilador � necess�rio conhecer o conceito de Gram�tica Livre de Contexto (GLC). Uma GLC � um conjunto de regras de substitui��o que podem ser aplicadas para que determinada senten�a seja produzida em uma linguagem.

Uma GLC � formada por: um conjunto de s�mbolos terminais (que correspondem a s�mbolos da linguagem e s�o tamb�m chamados de tokens), um conjunto de s�mbolos n�o-terminais ou vari�veis (que representam passos intermedi�rios), um conjunto de regras de produ��o (que mostram como podemos substituir os s�mbolos), e um s�mbolo inicial. Como exemplo, veja a gram�tica da Listagem 1.

Listagem 1. Exemplo de GLC

E ? E + E

E ? E - E

E ? E * E

E ? E / E

E ? ( E )

E ? id

E ? num

Essa gram�tica mostra como podem ser geradas express�es matem�ticas. Por exemplo, a produ��o �E ? E + E� nos mostra que a vari�vel �E� pode ser substitu�da por �E + E�. Assim, para construir uma express�o aritm�tica qualquer envolvendo identificadores e n�meros podemos ir aplicando as regras de substitui��o acima. Esse processo � chamado de deriva��o. Por exemplo, para derivar a express�o �id * ( id + num )� podemos usar as seguintes regras de produ��o:

E ? E * E ? id * E ? id * ( E ) ? id * ( E + E ) ? id * ( id + E ) ? id * ( id + num )

O que o lex e o yacc fazem � criar um programa tradutor que, recebendo como entrada um programa em uma linguagem, encontra uma deriva��o que produza essa entrada de acordo com determinada GLC.

Lex

O lex cuida de reconhecer os s�mbolos terminais: identificadores, n�meros, palavras reservadas, operadores, par�nteses etc.

Na Listagem 2 temos um fragmento de um arquivo lex (o arquivo completo est� no site da revista). O s�mbolo �%%� � um separador de se��es. Basicamente, o arquivo lex ir� descrever, entre o primeiro e o segundo �%%�, o que ser� retornado para cada padr�o que for encontrado. Assim, iremos retornar uma constante �_CREATE� quando encontrarmos a palavra �CREATE� no programa fonte, e assim por diante. Dever� haver uma entrada para cada palavra reservada da linguagem. J� NUM � um padr�o mais elaborado, descrito antes do primeiro �%%�, e que � formado por d�gitos com ponto opcional. Nesse caso, quando um n�mero for reconhecido, iremos retornar uma constante �_NUM� e iremos armazenar o seu valor na vari�vel global yylval, que � uma string do C++. Finalmente, o ponto significa um caractere simples: os operadores + e � , por exemplo.

Listagem 2. Exemplo do arquivo lex

WS [ \n\t]

LETTER [a-zA-Z_]

DIGIT [0-9]

ID ({LETTER}({LETTER}|{DIGIT})*)

NUM ({DIGIT}+(\.{DIGIT}+)?)

QQSTR (["][^"\n]*["])

QSTR (['][^'\n]*['])

{WS} {};

�CREATE� { return _CREATE; }

�REPLACE� { return _REPLACE; }

�IF� { return _IF; }

�THEN� { return _THEN; }

�ELSE� { return _ELSE; }

�END IF� { return _ENDIF; }

{NUM} { yylval = yytext; return _NUM; }

{ID} { yylval = yytext; return _ID; }

. { return yytext[0]; }

Yacc

O yacc ter� a descri��o GLC da linguagem a ser traduzida, no nosso caso, o PL/SQL. Junto com as regras de produ��o no yacc, iremos colocar trechos de c�digo que ser�o acionados para realizar a tradu��o de uma estrutura para sua correspondente no Firebird. Dessa forma, sempre que uma determinada produ��o for utilizada, o fragmento de c�digo associado a ela ser� executado.

Nota

Uma limita��o do yacc � que ele n�o deve ser utilizado com gram�ticas amb�guas. Gram�ticas amb�guas s�o as que permitem mais de uma �rvore de deriva��o, ou seja, significa que o compilador pode realizar a deriva��o de mais de uma forma diferente. O problema � que em geral apenas uma delas � correta.

A Listagem 3 apresenta um fragmento de uma GLC no yacc descrevendo o comando IF do PL/SQL. Novamente, os �%%� s�o separadores, e a gram�tica ir� ficar entre o primeiro e o segundo �%%�. Sempre que tivermos mais de uma possibilidade de substitui��o (p.e. E?E+E ou E?E�E) iremos agrup�-las atrav�s do s�mbolo �|� (p.e. E?E+E | E�E). No yacc, a �?� � substitu�da por um �:�; o �;� marca o fim da lista de produ��es, e o c�digo a ser executado vem entre chaves (o c�digo � ilustrado somente na Listagem 4).

Listagem 3. Fragmento do arquivo yacc

#token _ID _NUM _IF _THEN _ELSE _ENDIF

CMD_IF : _IF EXP _THEN CMDS _ENDIF

| _IF EXP _THEN CMDS _ELSE CMDS _ENDIF

;

CMDS : CMD �;� CMDS

| CMD �;�

;

Nesse exemplo n�o mostramos o restante da gram�tica para os s�mbolos EXP e CMD. Note que os s�mbolos terminais (tokens) s�o descritos antes do primeiro �%%� e dever�o ter o seu padr�o descrito no arquivo do lex. Vemos tamb�m que CMDS � uma lista de CMD separados por �;�: quando um caractere aparece entre plics quer dizer que ele deve aparecer no programa de entrada tamb�m.

Essa gram�tica nos informa que um comando IF do PL/SQL � sempre terminado por um ENDIF, possui um THEN e pode ter um ELSE ou n�o. Ap�s o THEN e ap�s o ELSE podem vir uma lista de comandos separados por �;�.

Atributos

Para facilitar a programa��o, o yacc disponibiliza um atributo para cada token encontrado durante a an�lise sint�tica. Assim, na produ��o �A ? X Y Z� teremos quatro atributos. Utilizamos os atributos dos s�mbolos do lado direito para calcular o valor do atributo do s�mbolo do lado esquerdo, ou seja, usamos X, Y e Z para calcular A. Finalmente, cada atributo � representado por um $ seguido do n�mero de sua posi��o: o A � $0, o X � $1, o Y � $2 e o Z � $3. O $0 pode ser escrito tamb�m como $$.

A Listagem 4 apresenta, para o exemplo da Listagem 3, a regra de tradu��o do IF em PL/SQL Oracle para IF em Firebird. � importante atentar que no Firebird n�o existe ENDIF, mas cada bloco de comandos deve vir entre BEGIN�END.

Listagem 4. Fragmento do arquivo yacc

CMDS : CMD �;� CMDS { $$ = $1 + �;\n� + $3; }

| CMD �;� { $$ = $1 + �;\n�; }

;

CMD : CMD_IF

| CMD_INSERT

| CMD_UPATE

... // trecho de c�digo suprimido

;

CMD_IF : _IF EXP _THEN CMDS _ENDIF { $$ = �IF � + $2 + � THEN \nBEGIN\n� + $4 +

�END;\n� }

| _IF EXP _THEN CMDS _ELSE CMDS _ENDIF { $$ = �IF � + $2 +

� THEN \nBEGIN\n� + $4 + �END\nELSE\nBEGIN\n� + $5 + �END;\n� }

;

Nesta listagem temos a tradu��o de um IF: (1) tomando os atributos do lado esquerdo e concatenando-os na ordem correta, (2) colocando as palavras BEGIN-END no local apropriado e (3) ignorando o ENDIF.

Estamos assumindo que cada comando ter� a sua pr�pria regra de tradu��o, como no caso do CMD_IF, CMD_INSERT, CMD_UPDATE etc. Cada uma dessas regras ir� calcular o seu atributo $$. A regra de tradu��o default � $$ = $1, ou seja, se nenhuma tradu��o for especificada o valor de $1 � copiado para o $$. Na listagem acima, na tradu��o de �CMD : CMD_IF� teremos o valor de $1 copiado diretamente para $$. Note que a tradu��o de �CMDS : CMD �;� CMDS� concatena os atributos do lado direito antes de copiar para $$. Com isso, o compilador ir� agir da seguinte forma: cada comando ter� uma regra de tradu��o, semelhante ao c�digo que mostramos para o CMD_IF. O resultado dessa tradu��o � copiado para CMD, e depois cada CMD � concatenado na regra CMDS, acumulando todo o c�digo do trigger em CMDS.

Tendo entendido como as coisas funcionam, nosso trabalho agora ser� criar uma gram�tica para o PL/SQL Oracle e projetar uma tradu��o das estruturas de cada comando para seu equivalente no Firebird.

A gram�tica utilizada

Agora definiremos de forma incremental a gram�tica. Inicialmente trataremos dos eventos e em seguida do bloco com as declara��es de vari�veis e comandos. A Listagem 5 ilustra a gram�tica inicial.

Listagem 5. Gram�tica Inicial

TRG ? _CREATE RPL _TRIGGER TRGNAME ORDER EVENTS _ON TRGTABLE FOREACHROW PLBLOCK

FOREACHROW ? _FOR _EACH _ROW

RPL ? _OR _REPLACE | ?

TRGNAME ? _ID '.' _ID | _ID

ORDER ? _BEFORE | _AFTER

EVENTS ? EVENTS _OR EVENT | EVENT

EVENT ? _INSERT | _UPDATE UPDCOLS | _DELETE

UPDCOLS ? _OF _ID COLS | ?

COLS ? ',' _ID COLS | ?

TRGTABLE ? _ID '.' _ID | _ID

Estamos usando a letra grega ? para simbolizar a substitui��o por vazio, de modo a representar comandos opcionais. Por exemplo, RPL pode ser substitu�do por �OR REPLACE� ou por vazio, de forma que podemos ter ap�s o �CREATE� a cl�usula �OR REPLACE� ou direto o nome do trigger. Al�m disso, no Firebird o �REPLACE� deve ser trocado por �ALTER�.

Para simular a funcionalidade �UPDATE OF coluna� presente no Oracle e ausente no Firebird iremos gerar um trigger de update come�ando com um IF que ir� testar se alguma das colunas presentes na lista de colunas do update foi alterada. Este teste consiste em comparar o valor novo com o velho: old.coluna <> new.coluna. Devemos apenas tomar cuidado com a l�gica do teste para considerar tamb�m valores nulos. O teste correto ser� (para cada coluna C): (new.C <> old.C) or (new.C is null and old.C is not null) or (new.C is not null and new.C is null). Esse mesmo artif�cio pode ser utilizado para simular a cl�usula WHEN. A Listagem 6 mostra o c�digo dessa tradu��o.

Listagem 6. Fragmento de C�digo do Yacc

string ofColumns;

TRG : _CREATE RPL _TRIGGER TRGNAME ORDER EVENTS _ON TRGTABLE FOREACHROW PLBLOCK

{

cout<<�SET TERM !! ;�;

cout<<�CREATE �<<$2<<�TRIGGER �<<$4<<� FOR �<<$8<