Oracle Data Integrator (ODI)

De que trata o artigo:

Uso da ferramenta Oracle Data Integrator (ODI) para a constru��o de processos ETL (Extract, Transform, Load). Neste artigo, utilizaremos o ODI para integrar dados de diferentes origens (SGBD Oracle, Firebird e arquivo texto) para uma base de destino Oracle.

Para que serve:

O ODI nos permite transformar o trabalho, muitas vezes ma�ante, da constru��o de processos ETLs, em interfaces e fluxos de f�cil desenvolvimento, manuten��o e visualiza��o.

Em que situa��o o tema � �til:

Al�m de padronizar e otimizar processos de ETL, o ODI � capaz de fazer a integra��o de diferentes tecnologias e bancos de dados em um �nico lugar, facilitando o trabalho de qualquer projeto que necessite fazer integra��o de dados.

Desvendando o Oracle Data Integrator � Parte II - Resumo DevMan:

Por ser uma ferramenta visual, o ODI proporciona um ambiente de f�cil desenvolvimento e manuten��o. Os diagramas ETL das interfaces do ODI s�o de f�cil entendimento, onde at� pessoas sem um grande conhecimento t�cnico entendem o processo ETL que ser� efetuado. Os M�dulos de Conhecimento (KMs) trazem uma padroniza��o e facilidade de manuten��o de c�digo incr�vel.

Fora o ambiente de desenvolvimento, o ODI traz um ambiente completo de monitoramento de execu��es (M�dulo Operator) dos processos ETL, onde � poss�vel ver todos os passos gerados pelo processo, assim como linhas inseridas, erros, tempo de execu��o, etc.

Para retomarmos a estrutura apresentada no artigo publicado na SQL Magazine 65, vamos relembrar de que maneira est� estruturada e armazenada as tabelas envolvidas no processo de ETL. Como explicado, embora nosso modelo esteja em um DER �nico, nossas origens est�o armazenadas em estruturas diferentes: as tabelas Cliente, TipoCliente, Venda e Vendedor est�o alocadas no banco de dados ORACLE; as tabelas Grupo, Item e ItVenda est�o no FIREBIRD; e ainda vamos utilizar uma fonte de dados oriunda de arquivo texto.

Para facilitar o entendimento e a leitura dos t�picos apresentados a seguir, vamos disponibilizar no contexto da estrutura relacional apresentada no primeiro artigo, todas as DDL�s e DML�s envolvidas nos processos descritos. Estes scripts podem ser obtidos no site da revista SQL Magazine.

DML (Linguagem de Manipula��o de Dados):A DML � um subconjunto da linguagem usada para selecionar, inserir, atualizar e apagar dados.

SELECT: � o mais usado do DML, comanda e permite ao usu�rio especificar uma query como uma descri��o do resultado desejado.
INSERT: � usada para inserir um registro (formalmente uma tupla) a uma tabela existente;
UPDATE: para mudar os valores de dados em uma ou mais linhas da tabela existente;
DELETE: permite remover linhas existentes de uma tabela.

Sequence:No Oracle � poss�vel gerar de forma autom�tica uma seq��ncia de n�meros, usando o comando sequence. Isto pode ser bastante �til quando se pretende criar um n�mero �nico para uma chave prim�ria.

Iniciando o desenvolvimento

Depois de configurada todas as Topologias (passos apresentados na primeira parte do artigo), vamos iniciar o desenvolvimento no m�dulo Designer. A primeira tarefa que temos � criar um novo projeto. Na aba Projetos do M�dulo Designer devemos clicar com o bot�o direito e escolher a op��o �Inserir Projeto�. Vamos nomear nosso projeto como �PROJETO_ETL� conforme Figura 1.

Ainda na Figura 1 vamos explorar alguns conceitos importantes. Na �Primeira Pasta� localizam-se os nossos objetos criados no ODI que s�o disponibilizados em estruturas de pastas para uma melhor organiza��o. Por�m, uma pasta sempre cont�m um conjunto de tr�s tipos de objetos: Pacotes, Interfaces e Procedimentos.

Pacotes: s�o os objetos que servir�o para modelar o nosso fluxo no processo de ETL. No pacote s�o armazenados os objetos utilizados e a liga��o entre eles. Depois que finalizamos a constru��o de um pacote, geramos a partir dele, um Cen�rio, que � a vers�o �compilada� do nosso pacote. Fa�amos uma analogia a um programa �comum�. Os pacotes cont�m os arquivos fonte do programa e os cen�rios s�o os execut�veis gerados a partir dos arquivos fonte;
Interfaces: s�o os objetos que realmente fazem o trabalho de ETL. Nas interfaces s�o definidas as tabelas de origem, de destino e quais as regras ser�o aplicadas no processo de ETL;
Procedimentos: como o nome indica, s�o objetos em que s�o escritos qualquer tipo de procedimento �extra� que se fa�a necess�rio no processo de ETL. Podemos criar procedimentos que contenham v�rios tipos de c�digos, de diferentes tecnologias suportadas pelo ODI, como por exemplo, escrever um procedimento em PL/SQL, em Java, em Jython, etc.

Dentro da hierarquia do �PROJETO_ETL� ainda temos:

Vari�veis: s�o utilizadas no ODI como qualquer vari�vel � utilizada em um programa. Elas armazenam um valor que � utilizado e modificado durante o processo de ETL;
Seq��ncias: o ODI nos d� a possibilidade de cria��o de Sequences, iguais a uma Sequence de Banco de Dados. Criamos seq��ncias no ODI quando a Tecnologia que estamos utilizando n�o nos permite ter uma Sequence pr�pria no banco;
Fun��es do Usu�rio: estas fun��es nos d�o a possibilidade de cria��o de fun��es que ir�o ser utilizadas v�rias vezes no processo de ETL. Por exemplo, se temos que fazer um determinado tratamento em uma string ou uma data, podemos criar uma fun��o para n�o ter que escrever a mesma fun��o v�rias vezes nas nossas Interfaces;
M�dulos de Conhecimento: s�o conhecidos tamb�m como KMs (Knowledge Modules). Os KMs s�o considerados os �cora��es� do processo de ETL no ODI. Eles s�o os respons�veis por todas as tarefas executadas nos processos de ETL.

Para melhorar o entendimento vamos detalhar cada tipo de M�dulo de Conhecimento (KM):

RKM - Reverse Knowledge Module (Engenharia Reversa): � o respons�vel por fazer uma reversa �customizada� dos armazenamentos de dados no ODI. Por exemplo: se existir uma situa��o em que se necessite fazer algum tipo de procedimento extra ao reverter um modelo de dados, podemos utilizar RKMs espec�ficos e n�o o padr�o para esta tarefa. O ODI faz reversas de tabelas automaticamente, mas podemos customizar estas reversas com um RKM;
LKM - Load Knowledge Module (Carga): � o respons�vel por carregar os dados das tabelas de origens no nosso processo de ETL quando estas tabelas se encontram em servidores de dados (Data Servers) diferentes;
CKM - Check Knowledge Module (Verifica��o): � o respons�vel por realizar as valida��es dos dados no processo de ETL. No ODI podemos criar check constraints pr�prias contendo alguma regra de neg�cio (por exemplo, valor n�o pode ser negativo) ou podemos validar FKs de banco antes de inserir os dados na tabela de destino, ou ainda, durante o pr�prio processo de ETL, podemos verificar dados not null, etc. O CKM � o respons�vel por executar todas estas verifica��es;
IKM - Integration Knowledge Module (Integra��o): � o respons�vel pela integra��o dos dados efetivamente no banco de destino. Ele resolve as regras do ETL descritas nas interfaces e insere os dados finais na tabela de destino;
JKM - Journalizing Knowledge Module (Documenta��o): � o respons�vel por fazer a jornaliza��o de dados quando se trabalha com este tipo de conceito. Pode ser usado, por exemplo, para se fazer replica��o de bancos de dados;
SKM - Service Knowledge Modules (Servi�o): � utilizado para publicar dados utilizando Web Services. Pode ser utilizado para gerar e manipular dados via Web Services para arquiteturas SOA (Service Oriented Architecture � Arquitetura Orientada a Servi�os);
Marcadores: s�o utilizados para colocar marcadores nos objetos criados no ODI. Servem para a organiza��o do projeto.

Nesta fase de nosso projeto ainda n�o temos nenhum KM. A cada novo projeto � fundamental a escolha de quais KMs iremos utilizar. Para o nosso projeto vamos importar os KMs necess�rios, que s�o dois:

LKM: para carregar os dados de origens diferentes do nosso destino;
IKM: para fazer a integra��o efetiva dos nossos dados para o destino;

No M�dulo Designer, acessamos a aba �Projetos� e clicamos com o bot�o direito sobre a op��o �Importar� e escolhemos a op��o �Importar Knowledge Modules...�. Devemos ent�o informar o diret�rio onde se encontram os KMs a serem importados. Originalmente os KMs que fazem parte da instala��o do ODI est�o na pasta �oracledi\oracledi\impexp�.

V�rias op��es ser�o apresentadas e devemos escolher as que se encaixam ao Projeto.

Os KMs que vamos utilizar no nosso projeto s�o:

LKM File to SQL: Carrega dados de arquivos texto e traz para uma �rea de armazenamento tempor�rio (ou �rea de estagiamento, ou stagging, onde ficam as tabelas tempor�rias que o ODI cria automaticamente no processo de ETL);
LKM SQL to ORACLE: Carrega dados de um banco de dados gen�rico para um banco de dados ORACLE;
IKM ORACLE Incremental Update: Integra os dados de forma incremental em um banco de dados ORACLE, ou seja, linhas que ainda n�o existem na tabela s�o inseridas, linhas que existem sofrem atualiza��o.

Quando os KMs j� estiverem importados podemos ter uma defini��o do que cada um faz, bastando clicar duas vezes sobre o mesmo, surgindo assim uma tela com a descri��o e a funcionalidade do mesmo.

Para este processo de ETL n�o importamos todos os KMs, pois isso dificultaria a sele��o dos mesmos no momento do desenvolvimento devido � grande quantidade de KMs existentes. Portanto, � uma boa pr�tica importar para o seu projeto apenas os KMs que ser�o realmente utilizados, a fim de trabalhar com um ambiente mais �limpo� e com menos chances de selecionar um KM errado. Em rela��o aos KMs importados para o nosso projeto, suas funcionalidades ficar�o mais claras no decorrer do Projeto, mais precisamente no momento do desenvolvimento das Interfaces.

Construindo a Estrutura do Projeto � Modelos de Dados

Partimos para a defini��o de nosso Modelo de Dados, e neste ponto o entendimento de dois conceitos s�o importantes: Modelo de Dados (Data Models) e o Armazenamento de Dados (Data Stores). Um Modelo de Dados pode conter N armazenamentos de dados (tabelas efetivas do banco de dados). � utilizado para agrupar tabelas de uma determinada tecnologia de um determinado Esquema L�gico. Em nosso Projeto teremos quatro Modelos de Dados, um para cada finalidade: Origem Oracle, Origem Firebird, Origem File e Destino Oracle. Dentro de cada modelo estar�o os nossos armazenamentos de dados, ou seja, nossas tabelas do banco de dados.

Portanto, dentro do M�dulo Designer, mais precisamente na aba Modelos, vamos criar pastas para melhor organiza��o. Vamos inserir duas pastas de modelos: uma chamada �Destinos� e outra �Origens�.

Agora vamos inserir as pastas de modelos para ambas. Para isso, basta clicar com o bot�o direito sobre a pasta Destinos e selecionar a op��o �Inserir Pasta de Modelos�. Vamos inserir a pasta �ORACLE�, onde ficar�o as tabelas de destino da tecnologia ORACLE, e repetimos a tarefa para as Origens, criando tr�s pastas: �FILE�, �FIREBIRD� e �ORACLE�, onde ficar�o as tabelas de origem das suas respectivas tecnologias.

Inserindo o Modelo de Dados Oracle � Origem

Vamos criar nosso Modelo da Origem ORACLE. Para esta tarefa devemos clicar com o bot�o direito sobre a Pasta de Modelo ORACLE que acabamos de criar e escolher a op��o �Inserir Modelo�.

Na janela que se abre devemos inserir o nome para o nosso modelo, selecionar a tecnologia (ORACLE) e a qual Esquema L�gico (ORACLE_ORIGEM) o modelo ir� se referenciar. O nome de nosso Modelo � auto-explicativo (MODELO_ORACLE_ORIGEM).

Ainda nas configura��es do Modelo vamos acessar a aba �Reverter�, pois devemos setar o Contexto que iremos utilizar para �importar� as nossas tabelas. Em nosso Projeto o Contexto selecionado � o �Desenvolvimento�. Nesta aba tamb�m devemos selecionar quais tipos de objetos queremos que a reversa importe para o ODI. Para o nosso caso selecionamos apenas Tabelas, pois queremos reverter apenas as tabelas criadas nos scripts (que se encontram no site da SQL Magazine). Nesta aba de configura��o poder�amos tamb�m aplicar alguma m�scara de filtro para que no momento da reversa o ODI selecionasse apenas os objetos que se adequassem a esta determinada m�scara.

A pr�xima aba de configura��o � a �Revers�o Seletiva� (Figura 2). Nesta aba devemos escolher, das tabelas que passaram no filtro anterior, quais tabelas importar para o ODI. Para o nosso projeto iremos importar as quatro tabelas que est�o alocadas no banco de dados. Ap�s selecionar as tabelas podemos clicar na op��o �Aplicar�, e ap�s em �Reverter�.

**Figura 2**. Executando a Reversa do Modelo de Origem.

Uma mensagem de confirma��o ser� exibida: �Deseja fazer engenharia reversa neste modelo antes de fechar esta janela?� Se anteriormente j� clicamos na op��o �Reverter� podemos clicar em �N�o� nesta confirma��o. Depois de �revertido�, teremos as tabelas da nossa origem ORACLE no ODI.

Inserindo o Modelo de Dados Firebird � Origem

Devemos agora inserir o Modelo de Dados tamb�m para o Firebird. Faremos o mesmo processo detalhado anteriormente apenas alterando a Tecnologia escolhida. Selecionamos a Tecnologia Interbase que foi a selecionada para utiliza��o com o Firebird no momento da cria��o da Topologia.

Conforme a Figura 3, selecionamos a tecnologia Interbase e o Esquema L�gico FIREBIRD_ORIGEM.

**Figura 3**. Criando modelo de Origem do Firebird.

Ap�s selecionar o contexto e quais objetos queremos importar na aba Reverter (novamente selecionamos Tabelas), e quais as tabelas que importaremos na aba Revers�o Seletiva (tabelas criadas no script que se encontra no site da SQL Magazine), podemos clicar na op��o �Aplicar� e ap�s em �Reverter�. Se o procedimento for correto, as tabelas da Origem Firebird ser�o importadas.

Inserindo o Modelo de Dados File � Origem

Terminada a inclus�o dos Modelos de Dados ORACLE e Firebird vamos partir para a inclus�o do Modelo de Dados do tipo FILE. Para esta tecnologia existem algumas particularidades que devem ser observadas. Vamos proceder com a cria��o do modelo de forma normal seguindo os padr�es da inclus�o da Tecnologia ORACLE. Nomeamos o modelo para MODELO_FILE_ORIGEM e selecionamos a Tecnologia FILE. Tamb�m associamos neste ponto o Esquema L�gico FILE_ORIGEM. Vamos � aba Reverter, selecionando o contexto �Desenvolvimento�. A �nica particularidade est� no momento de salvar o modelo: devemos salv�-lo sem revert�-lo.

Podemos notar que o ODI n�o apresentou nenhuma mensagem de aviso ou confirma��o em rela��o � reversa no momento que n�s criamos o modelo. Isso acontece porque a Tecnologia FILE n�o segue necessariamente um padr�o. Podemos ter arquivos com delimita��es por caracteres, como �;� (ponto e v�rgula) ou ent�o �|� (pipe) como podemos ter arquivos que n�o s�o delimitados mas sim fixos por um determinado valor em cada coluna. Todos estes padr�es se encaixam na Tecnologia FILE. Devido a particularidades de cada arquivo devemos fazer a reversa de cada arquivo de forma individual.

Para isso devemos estar no Reposit�rio de Trabalho do ODI, e clicar com o bot�o direito no �MODELO_FILE_ORIGEM� que se encontra dentro da pasta FILE. Devemos escolher a op��o �Inserir Armazenamento de Dados�.

Na janela que ser� exibida, na aba �Defini��o�, devemos colocar um nome para o modelo de dados e devemos escolher o arquivo correspondente que queremos reverter. Neste caso o arquivo � do tipo TXT (dtempo.txt) e armazena as informa��es referentes � dimens�o tempo de nosso Data Warehouse. Depois de feita a sele��o do arquivo, vamos para a aba �Arquivos� (Figura 4), onde devemos informar se o arquivo possui ou n�o delimita��o. No nosso caso, escolhemos que ele � �Delimitado�. Neste ponto informamos que o caractere separador de campos do arquivo dtempo.txt � o �;� (ponto e v�rgula). Tamb�m nesta estrutura de configura��o podemos informar se o arquivo possui cabe�alho e de quantas linhas o mesmo � formado. Para este caso informamos o valor 0 (zero). Se algum valor fosse informado, a quantidade de linhas informada seria retirada do in�cio do arquivo e seria desprezada.

Outra op��o que precisamos definir diz respeito ao �Separador de Registros�. Podemos selecionar se o arquivo tem separador do tipo:

MS-DOS (CR+LF (Carriage Return / Line Feed) = '\r\n' � hexa 0D0A);
UNIX (LF (Line Feed) = '\n' � hexa 0A).

**Figura 4**. Criando o armazenamento de dados da origem TXT.

Estes padr�es de separadores de registros se referem �s poss�veis quebras de linhas do arquivo. Tamb�m devemos configurar o delimitador de texto que neste caso � � (aspas simples), ou seja, as strings do arquivo texto s�o envoltos por aspas simples. Com esta configura��o o ODI ir� considerar apenas o conte�do �interno� da string ignorando as aspas.

Neste ponto tamb�m podemos indicar qual separador decimal os nossos valores est�o utilizando, o que n�o se aplica neste caso.

Finalizando o processo de configura��o devemos clicar na aba �Colunas� e selecionar a op��o reverter. Neste momento o ODI busca as informa��es da aba �arquivos� e separa em colunas automaticamente (Figura 5).

**Figura 5**. Coluna do modelo de origem TXT.

Por padr�o as colunas ficam com nomes C1, C2, C..., mas podem ser renomeadas conforme necessidade e\ou organiza��o.

Inserindo o Modelo de Dados Oracle � Destino

Vamos agora proceder com a cria��o do modelo de destino seguindo os padr�es da inclus�o da tecnologia Oracle para Origem. Nomeamos o modelo como MODELO_ORACLE_DESTINO conforme Figura 6.

**Figura 6**. Cria��o do Modelo de destino Oracle.

Devemos reverter as tabelas repetindo os mesmos passos do modelo de dados Oracle da origem. Para isso, na aba Defini��o devemos selecionar a tecnologia Oracle e o esquema l�gico ORACLE_DESTINO. Na aba Reverter selecionamos o contexto de Desenvolvimento e o tipo de armazenamento de dados a ser revertido (Tabela), e na aba Revers�o Seletiva escolhemos as tabelas contidas no script dispon�vel no site da SQL Magazine. Depois deste passo estamos prontos para iniciar o desenvolvimento das interfaces.

Iniciando o Desenvolvimento das Interfaces

Neste ponto iniciamos efetivamente o desenvolvimento ETL. Vamos desenvolver as interfaces, procedimentos, vari�veis e pacotes, que ser�o os objetos utilizados para a realiza��o do ETL.

Desenvolvimento da Interface � Carga Destino DIM_CLIENTE

Para iniciarmos o desenvolvimento das interfaces vamos alternar da aba Modelos para a aba Projetos no M�dulo Designer. Nesta aba vamos alterar o nome da �Primeira Pasta� para �DW�. Esta altera��o pode ser feita dando duplo clique sobre a estrutura.

Vamos iniciar carregando as dimens�es do DW. A primeira interface a ser desenvolvida dever� fazer a carga de dados para a Dimens�o Cliente. Ainda na aba Projetos devemos expandir a pasta DW e clicar com o bot�o direito sobre Interfaces selecionando a op��o �Inserir Interface�, conforme Figura 7.

**Figura 7**. Inserindo uma nova interface.

Vamos desenvolver a Interface para contemplar o ETL da Dimens�o Cliente e, portanto, nomeamos a Interface como CLIENTES_IN. Neste passo tamb�m devemos selecionar o contexto de otimiza��o, que serve para o ODI montar o fluxo de execu��o (Figura 8).

**Figura 8.** Criando a interface de clientes.

Para melhorar a explica��o sobre o contexto de otimiza��o, vamos imaginar o seguinte exemplo: temos em desenvolvimento dois esquemas que apontam para uma mesma instancia de banco de dados. Para o ODI, como os dois esquemas est�o no mesmo banco n�o seria necess�ria a utiliza��o de um LKM (o LKM busca os dados de data servers diferentes), pois o IKM (m�dulo de integra��o) conseguiria fazer sozinho a integra��o de dados, otimizando assim o c�digo, pois diminuiria os �passos� do mesmo. Por�m, se estes mesmos esquemas, em um contexto de Produ��o, estiverem em servidores fisicamente separados, o ODI necessitaria utilizar um LKM, pois a sua origem est� fisicamente separada do destino.

Se a interface fosse constru�da com o contexto de otimiza��o menos �fragmentado� (como o de desenvolvimento neste caso) ter�amos um problema ao rodar esta interface em produ��o, pois o c�digo gerado n�o contemplaria um LKM.

Portanto, ao selecionar um contexto de otimiza��o, devemos escolher sempre o contexto mais �fragmentado�, pois o ODI ir� se basear neste contexto para montar o fluxo do ETL. No nosso caso, como temos apenas um contexto, pode-se manter o contexto de desenvolvimento. Outra op��o que podemos selecionar nesta etapa (Figura 8) esta relacionada � �rea de Stagging, que pode ser diferente do destino. Por padr�o, a �rea de Stagging � sempre no destino, ou seja, os objetos tempor�rios necess�rios ao processo de ETL ser�o criados no Esquema de Trabalho do destino setado anteriormente, no momento da cria��o da topologia (ESQUEMA_TMP do banco ORACLE).

Neste ponto poder�amos selecionar qualquer esquema para ser a Stagging, mas vamos mant�-lo no Esquema de Trabalho do destino. Ap�s inserir esta nova Interface devemos acessar a aba �Diagrama�. Nesta estrutura ser�o armazenados todos os relacionamentos, regras e mapeamentos de origem e destino que dever�o ser configurados. No lado direito (Figura 9) temos a tabela de destino, no esquerdo, teremos as tabelas de origem e seus relacionamentos.

**Figura 9.** Diagrama de uma Interface.

Na estrutura do Diagrama vamos montar a regra de ETL para o nosso destino. Primeiro devemos clicar na aba �Modelos� e selecionar a estrutura DESTINOS/ORACLE/MODELO_ORACLE_DESTINO. Ap�s localizar a estrutura basta clicar e arrastar a tabela DIM_CLIENTE para dentro da estrutura de armazenamento DESTINO, como pode ser visto na Figura 10.

**Figura 10.** Adicionando as tabelas de Origem.

Posteriormente devemos selecionar e arrastar a ORIGEM para o lado esquerdo do Diagrama. Neste momento o ODI pergunta se desejamos fazer o mapeamento autom�tico dos campos. Como na nossa estrutura a nomenclatura das colunas s�o iguais, o mapeamento iria funcionar sem problemas. Na pr�tica de desenvolvimento de um projeto, o mapeamento autom�tico n�o � recomendado. Na grande maioria dos casos, as nomenclaturas de origem e destino s�o diferentes e\ou existir� alguma regra de transforma��o. Desta forma o ODI pode mapear campos para os locais errados, gerando re-trabalho para mape�-los novamente.

Portanto, selecione �N�o� e vamos mapear manualmente. Por�m, antes disso, temos que fazer um join entre tabelas de origem com o objetivo de popular a tabela DIM_CLIENTE. A DIM_CLIENTE recebe tanto as informa��es dos clientes quanto do seu tipo. Para isso, clique e arraste TIPOCLI para o diagrama. Podemos ver pela Figura 11 que o ODI identificou as colunas que fazem relacionamento entre as tabelas e j� colocou o join automaticamente.

**Figura 11.** Montando os Joins entre as tabelas de Origem.

Se o processo de montagem dos joins n�o acontecesse de forma autom�tica ter�amos que clicar sobre a primeira coluna do relacionamento, arrastar e soltar em cima da segunda coluna do relacionamento. Este � o processo manual quando o mapeamento automatizado n�o acontece.

Podemos notar ao clicar no join (Figura 12) que v�rias op��es s�o apresentadas (todas s�o auto-explicativas), como por exemplo, se o join vai ser um inner join ou um left outer join. Clicando nos diferentes tipos de joins, o ODI nos diz o que ir� acontecer em cada caso.

**Figura 12.** Op��es de Join para montagem da interface de carga.

No caso apresentado para a constru��o da DIM_CLIENTE utilizamos um inner join. Esta tarefa avisa que retornar� �Todas as linhas emparelhadas pela condi��o de uni�o entre CLIENTE e TIPOCLI�.

IMPORTANTE: Neste ponto temos a op��o de executar este join na origem ou na �rea de teste (stagging). Se for na stagging, o ODI trar� as duas tabelas inteiras para o esquema de trabalho e depois far� o join entre elas. Se a op��o � na origem, o ODI far� o join na origem e trar� apenas o resultado daquele join para o esquema de trabalho.

Esta escolha depende de cada caso. No nosso exemplo � mais eficiente resolver o join na origem e trazer resolvido para o destino, pois isso resultar� em trazer apenas os registros que obedeceram � regra do join, tornando assim o volume de dados trafegados de uma ponta a outra menor.

Para mapear um campo no ODI o processo � relativamente simples. Deve-se clicar no campo de destino que se deseja mapear, clicar no campo de origem a ser mapeado, arrastar e soltar na �rea branca �Implementa��o�, que fica na parte de baixo do diagrama. O resultado pode ser visto na Figura 13.

**Figura 13.** Mapeando uma coluna no ODI.

Faltou apenas o mapeamento do campo ID_CLIENTE e neste passo faremos algo diferente. Todas as tabelas de destino t�m um ID pr�prio e �nico que � a PK da tabela. Estas PKs devem ser populadas com um n�mero �nico de uma sequence chamada SEQ_DESTINOS, que se encontra criada no banco de destino.

Agora, devemos clicar sobre a coluna ID_CLIENTE e clicar diretamente no �cone do �l�pis� para abrir o editor de express�es (Figura 14).

O editor de express�es auxilia a montar as express�es que estar�o mapeadas nas colunas. Neste caso, mapeamos uma sequence na coluna ID_CLIENTE. Para isso, prefixamos o esquema onde a mesma se encontra no banco, por exemplo, ESQUEMA_DESTINO.SEQ_DESTINOS.

O procedimento de manter prefixado (ESQUEMA.OBJETO) o esquema na Interface desenvolvida n�o � recomendado para grandes projetos. Exemplo: o esquema principal est� nomeado como ESQUEMA_DESTINO em desenvolvimento, mas em outro ambiente (produ��o) o esquema pode variar de nome. Esta altera��o faria com que a Interface n�o executasse de maneira correta. A solu��o deste problema seria utilizar uma fun��o pr�pria do ODI que retorna o nome do esquema em que a interface esta sendo executada. Esta fun��o pode ser encontrada dentro do Editor de Express�es (Figura 15), mais precisamente em Fun��es OdiRef. O ODI possui v�rias fun��es muito �teis. A lista completa destas fun��es podem ser encontradas no manual de refer�ncia da ferramenta.

Para este exemplo em vez de ter uma sequence com o esquema prefixado (ESQUEMA_DESTINO.SEQ_DESTINOS) substituir�amos pela fun��o denominada getShemaName, Figura 15.

Ap�s escrever o comando a ser mapeado confirmamos com um �OK� na janela. Voltamos para a montagem da Interface. Notamos na Figura 16 que, ao lado do nome das colunas, encontram-se pequenos �cones, como uma pequena janela, um martelo (que ainda n�o se encontra na tela), um alvo e uma chave.

**Figura 16.** Mapeamento completo para DIM_CLIENTE.

Cada s�mbolo possui um significado:

Janela: indica que o campo ser� resolvido na origem e ser� avaliado durante o processo do ETL;
Martelo: indica que o campo ser� �resolvido� na �rea de stagging e ser� avaliado durante o processo do ETL;
Alvo: indica que o campo ser� �resolvido� apenas no destino, o que significa que ele n�o ser� avaliado durante o ETL e ser� apenas inserido no destino;
Chave: indica a chave da tabela. Por default, o ODI escolhe para ser a chave a pr�pria chave prim�ria (PK) da tabela, mas, como veremos neste caso, podemos modificar a chave para fazer com que o ODI resolva o ETL da maneira que n�s desejamos.

Podemos trocar o local que o campo ser� executado (resolvido) clicando na coluna que desejamos modificar e em seguida na op��o �Executar em:�, selecionando o local escolhido. No caso da sequence, iremos especificar que ir� executar no ambiente de destino. Esta troca de diret�rio tem um motivo: a sequence n�o deve ser avaliada durante o processo de ETL e deve ser executada somente no momento da inser��o do novo registro no destino. Se n�o for estruturada desta maneira causar� um erro na sua execu��o.

Outra tarefa necess�ria � a altera��o da chave da tabela Cliente. Esta tabela tem como PK o campo ID_CLIENTE e � populado por uma sequence. Isso significa que o valor da PK sempre muda e novos registros seriam inseridos na tabela sempre que a Interface fosse executada. Se execut�ssemos dez vezes a carga, os clientes estariam dez vezes duplicados na tabela de destino.

O correto para a tabela Cliente � existir apenas um c�digo por cliente, ou seja, precisamos que a coluna CDCLI seja a chave natural (NK � Natural Key). Para o ODI levar em considera��o a coluna CDCLI como chave e n�o a atual PK ID_CLIENTE devemos proceder com a altera��o conforme a Figura 17. Ao clicar sobre a tabela de destino DIM_CLIENTE percebemos que na op��o �Atualizar Chave� est� selecionado �DIM_CLIENTE_PK� que representa a PK da tabela no ODI.

Trocamos o �Atualizar Chave� para a op��o �sem defini��o� e agora temos a liberdade de selecionar a chave que necessitamos. Selecionamos ent�o a coluna CDCLI e clicamos em �chave�, conforme Figura 18.

**Figura 18.** Mapeamento de DIM_CLIENTE.

Com isso a chave para o ODI passa a ser CDCLI. Clicando sobre as colunas, podemos notar na estrutura �Atualizar�, check-boxes de �Inserir�, �Atualizar�, �UD1�, �UD2�, etc. (Figura 19). Estes checks funcionam para configurar se o campo ser� inserido no destino, se ele ser� atualizado no destino ou se ele executar� alguma das fun��es definidas pelo usu�rio (UD � User Defined). No nosso caso, todos os campos por padr�o est�o marcados como �Inserir� e �Atualizar�. Por�m, no caso da coluna ID_CLIENTE devemos desmarcar a op��o �Atualizar� (Figura 19), pois a sequence n�o pode participar do passo de update gerado pelo KM sob o risco de erros serem gerados na execu��o. Este processo ficar� mais claro no momento da execu��o da interface que ser� explicado a seguir.

**Figura 19.** Configurando o comportamento dos campos.

Conclu�da as configura��es vamos para a aba �Fluxo�. Na tela de Fluxo (Figura 20) � representada a forma como a ferramenta ir� fazer a execu��o da Interface.

**Figura 20.** Fluxo de trabalho do ODI.

Para este caso o ODI demonstra apenas um �nico exemplo com a utiliza��o do IKM, que por si s� ir� resolver todo processo de ETL. Esta estrutura � �nica devido �s tabelas que estamos utilizando como origem e as tabelas que queremos popular (tabelas de destino) se encontrarem em um mesmo Data Server (uma mesma Origem) configurado na topologia.

Se esta estrutura estivesse em Data Servers diferentes, a ferramenta nos mostraria duas estruturas distintas, uma com a composi��o de um LKM respons�vel pela carga dos dados para as �reas de stage e outra com o IKM que realizaria os demais processos de ETL. Este caso ser� explorado no momento da constru��o das Interfaces que carregam os dados oriundos dos arquivos do tipo texto e do banco de dados Firebird.

Ao clicar sobre a caixa denominada �Alvo-�rea de Teste� (Figura 20) podemos observar que o KM utilizado por padr�o � o IKM (Oracle incremental Update). Resumidamente este KM faz cargas incrementais, ou seja, ele verifica a chave definida na interface (CDCLI neste caso) e se esta chave ainda n�o existe no destino o processo faz a inser��o da mesma de forma autom�tica. Se esta chave j� existe o processo apenas faz o Update nas colunas selecionadas com a op��o �Atualizar� (Figura 19).

Podemos notar tamb�m que o KM vem com v�rias op��es de valores padr�es. Ao clicar sobre cada op��o, ao lado, apresenta-se a sua descri��o. Para este trabalho iremos modificar apenas a op��o �Flow Control� que devemos mudar para op��o �n�o� (Figura 20). Quando a op��o descrita estiver selecionada como �Sim� o ODI ir� invocar o CKM (Valida��es � Ver explica��o sobre CKM neste artigo) selecionado e far� a verifica��o dos dados durante o processo de ETL. Como n�o criamos nenhuma valida��o para esta tabela, podemos retirar a op��o de �Flow Control� desta interface.

Para realizar a execu��o da interface basta clicar sobre o bot�o �Executar� no canto inferior direito da interface (Figura 21). Neste momento ser� apresentada uma tela questionando em qual contexto executar, neste caso o contexto de Desenvolvimento; qual o agente, vamos executar no agente local; e o n�vel de registro, que indica o grau de informa��es que deve ser gerado no log do ODI, que podemos deixar o valor padr�o 5.

**Figura 21.** Execu��o de uma Interface.

Durante a execu��o da Interface podemos acessar a �Lista de sess�es� do m�dulo Operator e acompanhar o processo de execu��o das cargas (Figura 22).

Verificando a execu��o (Figura 22), podemos observar os passos criados pelos KMs do ODI. Reparamos que a primeira palavra escrita � �Integra��o�. Isto significa que todos os passos gerados por esta Interface foram de um IKM.

Para carregar a tabela DIM_CLIENTES, a ferramenta gerou onze passos distintos. Os �cones em verde indicam comandos executados com sucesso. �cones em amarelo indicam que o comando falhou, por�m a execu��o continua normalmente. �cones em vermelho significam erros que interrompem a execu��o da carga, que n�o foi o caso.

No exemplo da Figura 22 percebe-se que o passo indicou �aten��o�. Isto aconteceu porque o ODI tentou dropar uma tabela tempor�ria que ainda n�o existia no banco. Clicando duas vezes sobre qualquer passo � poss�vel ver o que executou, quanto tempo levou para executar a carga, quantas linhas foram inseridas, entre outros.

**Figura 22.** Execu��o da Interface CLIENTES_IN.

Esta Interface (CLIENTES_IN) inseriu sete linhas na tabela de destino. Se esta Interface fosse executada novamente ver�amos novamente os mesmos onze passos, mas no processo nenhuma nova linha seria inserida. Como esta Interface � incremental, ela carrega apenas as linhas que ainda n�o foram carregadas e faz a atualiza��o de linhas quando a mesma n�o existir.

DICA: Para compreender melhor como funcionam as configura��es feitas no ODI, tente marcar a op��o �Atualiza��o� no campo ID_CLIENTE que � carregada juntamente com a sequence ou mude o local de execu��o de �Destino� para �Stagging� e compare os passos de uma execu��o e outra. No come�o parece complicado, mas depois que aprendemos os �pequenos truques� da ferramenta verificamos que o ODI � uma poderosa e flex�vel ferramenta para processos ETL.

Desenvolvimento da Interface � Carga Destino DIM_PRODUTO

O pr�ximo passo para o projeto � criar a Interface que carrega a tabela DIM_PRODUTO. A tarefa para montagem da carga � a mesma explanada anteriormente. Desta forma, vamos direto para o Diagrama da Interface (Figura 23). Todas as tabelas desta estrutura s�o provenientes da origem FIREBIRD.

Importante: Devemos efetuar a modifica��o da coluna ID_PRODUTO para ser executada no banco de destino (�cone do �Alvo� da coluna ID_PRODUTO na Figura 23). Tamb�m devemos desmarcar a op��o �Atualizar� para este atributo. Outra modifica��o que dever� ser efetuada � a troca da chave da tabela (DIM_PRODUTO) para ser CDITEM e CDGRUPO, pois estes dois atributos referenciam a NK (Natural Key - Chave Natural) da tabela. Outro ponto importante � que ao clicar no �cone do �l�pis�, o ODI perguntar� qual � a tecnologia a ser considerada no editor, pois temos duas tecnologias no diagrama (Firebird e Oracle). Selecionaremos o Oracle pois a sequence est� no banco Oracle.

Clicando na estrutura da aba �Fluxo� temos uma novidade: a �caixa� do LKM (Figura 24). Esta estrutura se encontra presente devido � necessidade de carregar dados que se encontram em outro banco de dados (neste caso o Firebird).

Com isso o ODI primeiro extrai estes dados da base de origem repassando os mesmos para a stagging �rea. Em rela��o ao IKM, este ter� o papel de pegar os dados e inserir nas tabelas de destino.

Para a carga da tabela destino DIM_PRODUTO, vamos utilizar o LKM SQL to Oracle. J� em rela��o ao IKM selecionamos o IKM Oracle Incremental Update n�o esquecendo que neste devemos modificar a op��o de �Flow Control� para �N�o�.

Ao executar esta Interface os resultados podem ser consultados na �lista de sess�es� do Operator (veja a Figura 25).

Notamos na Figura 25 que o n�mero de passos de execu��es aumentou para dezessete e que temos descri��es das a��es como �Carregando� e �Integra��o�. Os passos com as descri��es carregando se referem aos passos gerados pelo LKM e os passos com �Integra��o� se referem aos passos gerados pelo IKM.

Desenvolvimento da Interface � Carga Destino DIM_VENDEDORES

Para criar a interface de vendedores basta seguir os mesmos passos das interfaces anteriores: selecionamos o nosso destino, a nossa origem, mapeamos os campos, colocamos a execu��o da sequence no alvo, desmarcamos a op��o de �Atualizar� e trocamos a chave para CDVEND (Figura 26).

**Figura 26.** Mapeamento de VENDEDORES_IN.

Em alguns casos a utiliza��o de um filtro para os dados se torna necess�ria e pode auxiliar no processo de carga. Para exemplificar a utiliza��o de um filtro na Interface de carga vamos inserir para esta interface, especificamente, um filtro na nossa origem (representada por um funil amarelo no diagrama � Figura 26). Para fazer um filtro, basta clicar no campo que se deseja filtrar, arrast�-lo para o lado e soltar na �rea livre do diagrama. Ap�s isso, podemos montar a estrutura e escrever o filtro que desejamos fazer. Neste caso colocaremos que o campo PERCCOM deve possuir valor menor a 50 (Figura 27).

**Figura 27.** Utilizando filtro no ODI.

Esta carga possui somente o IKM, pois se trata do mesmo banco de dados e far� a carga com a estrat�gia incremental (IKM Oracle Incremental Update). Modificamos a op��o do �Flow Control� para �N�o� e executamos a interface.

Desenvolvimento da Interface � Carga Destino DIM_TEMPO

Para a carga da dimens�o tempo temos uma particularidade. A origem para esta carga � um arquivo texto com uma estrutura simples (Figura 28).

**Figura 28.** Mapeamento para TEMPO_IN.

Aqui temos uma novidade: no mapeamento da coluna DATA_DIA utilizamos a fun��o TO_DATE do Oracle (Figura 29), pois estamos lendo uma string do arquivo texto e estamos populando um campo do tipo DATE (TO_DATE(DTE.DATA_DIA,'DD/MM/YYYY')). Neste caso n�o iremos utilizar a sequence do banco e sim a pr�pria sequence existente no arquivo texto.

**Figura 29.** Mapeamento utilizando procedimento TO_DATE.

Na aba fluxo para este caso teremos um LKM e um IKM. O LKM que iremos utilizar ser� o LKM File to SQL. Para o IKM utilizaremos o Oracle Incremental, onde devemos setar a op��o �Flow Control� igual a �N�o�. Executando a interface podemos ver o resultado no Operator, como explicado anteriormente.

Desenvolvimento da Interface � Carga Destino FATO_VENDAS

Esta interface j� tem uma l�gica mais elaborada (Figura 30): estamos buscando as informa��es de duas origens: a tabela VENDA que tem sua origem proveniente do banco de dados Oracle e da tabela ITVENDA que vem do banco de dados Firebird. Al�m dessas origens ainda fazemos joins com as nossas tabelas de Dimens�es, pois precisamos buscar os IDs que foram gravados anteriormente nas nossas interfaces. Os joins que s�o realizados s�o os seguintes:

VENDA.NUMNF=ITVENDA.NUMNF;
VENDA.CDCLI=DIM_CLIENTE.CDCLI;
(DIM_PRODUTO.CDITEM=ITVENDA.CDITEM) AND DIM_PRODUTO.CDGRUPO=ITVENDA.CDGRUPO;
DIM_VENDEDOR.CDVEND=VENDA.CDVEND;
VENDA.DTVENDA=DIM_TEMPO.DATA_DIA.

Para este caso vamos inserir outro filtro (para refor�ar o exemplo de utiliza��o): DIM_TEMPO.TURNO = 'Manh�'. Notamos na Figura 30 que a estrutura DIM_TEMPO possui, assim como explicado anteriormente, um pequeno �funil� amarelo representando que existe um filtro no processo de carga desta estrutura.

**Figura 30.** Diagrama de FATO_VENDAS_IN.

No fluxo selecionamos o LKM SQL to Oracle para ler as tabelas do banco Firebird e o IKM Oracle Incremental Update para fazer a carga. Marcamos tamb�m a op��o �Flow Control� no IKM para �N�o�. Como padr�o, podemos executar a interface e ver o seu resultado no Operator.

Desenvolvimento do Pacote para Carga de Dados

Ap�s executar individualmente cada Interface podemos consultar as tabelas de destino e conferir que todas est�o carregadas. Mesmo com a efici�ncia comprovada para cada carga este n�o � um modo pr�tico para execu��o de cargas. Em um grande projeto, por exemplo, estas Interfaces n�o poderiam ser enviadas para outros ambientes, pois n�o s�o estruturas compiladas para execu��o em outros ambientes. Neste sentido necessitamos criar Pacotes para controlar o fluxo e criar cen�rios compilados para que a execu��o em outros ambientes seja garantida.

Para inserir um novo Pacote, no projeto DW, clique com o bot�o direito sobre a op��o �Pacotes� e em seguida selecione �Inserir Pacote�. Na aba �Defini��o� nomeamos o pacote. � na aba �Diagrama� que ser� desenvolvido o fluxo do processo de ETL. Nesta mesma tela pode-se encontrar v�rias funcionalidades (em forma de bot�es) que podem ser detalhados com o simples �passar� do mouse sobre cada um.

A caixa de ferramentas do ODI cont�m diversos objetos que podem ser inclu�dos no fluxo ETL do nosso pacote. Entre eles temos objetos de envio de e-mail, execu��o de comandos do sistema operacional, processo de espera de eventos (tempo limite ou espera de algum registro em alguma tabela espec�fica), manipula��o de arquivos, entre outros. O detalhamento de cada componente pode ser visto no arquivo de ajuda do ODI, que se encontra no menu Ajuda na parte superior da tela.

Para montar o fluxo devemos colocar as interfaces no diagrama do pacote. Para isso, clicamos sobre alguma interface e arrastamos para dentro do diagrama, conforme Figura 31.

**Figura 31.** Adicionando as Interfaces ao Pacote.

Podemos notar na Figura 31 que a interface CLIENTES_IN possui uma pequena �flecha verde� que indica que ela vai ser o primeiro objeto a ser executado. Para modificar qual objeto ser� o primeiro a ser executado � poss�vel clicar em cima do objeto escolhido com o bot�o direito e escolher a op��o �Primeira etapa�. Se execut�ssemos o pacote neste momento somente a interface CLIENTES_IN seria executada, pois ainda n�o criamos o fluxo de execu��o completo do pacote.

Para criar este fluxo devemos clicar no bot�o �ok� (Etapa seguinte ao �xito) que cont�m uma flecha verde, na barra superior. Ap�s este passo deve-se clicar sobre o objeto de origem e arrastar at� o objeto de destino, conforme Figura 32. Temos tamb�m o bot�o �ko� (Pr�xima etapa ao falhar) que cont�m uma flecha vermelha, que desviar� o fluxo se algum erro acontecer. Aplicaremos o fluxo de erro em momentos onde for pertinente.

**Figura 32.** Criando Fluxo de Execu��o.

O mesmo procedimento deve ser repetido para o restante das Interfaces (Figura 33). Ap�s isso, executaremos o pacote clicando no bot�o �Executar� (canto inferior direito).

OBSERVA��O: Para manipular o local dos objetos no pacote, escolha o primeiro bot�o (o cursor branco � �Escolha livre�) na barra superior.

Observando a execu��o da Interface no m�dulo Operator (Figura 34) podemos verificar que agora todas as nossas interfaces est�o agrupadas em uma �nica execu��o do pacote, evitando a execu��o individual de cada uma.

Outra tarefa importante pode ser realizada neste Pacote. Vamos implementar um LOG personalizado para guardar as informa��es importantes relacionadas a execu��o deste Pacote. Para isso usaremos a tabela LOG_CARGA que conter� o ID da sess�o do ODI correspondente � execu��o e uma descri��o informando se todos os processos da carga executaram com sucesso ou com erro. Para completar esta demanda vamos precisar criar uma Vari�vel e dois novos Procedimentos: um para inserir os dados e outro para retornar o ID da sess�o. Para completar esta tarefa precisamos entender melhor o que � uma Vari�vel e um Procedimento no ODI.

Criando Vari�veis

Para criar uma Vari�vel devemos acessar o projeto PROJETO_ETL, na aba projetos, clicar com o bot�o direito sobre a op��o �Vari�veis� e escolher �Inserir Vari�vel�. Na aba �Defini��o�, colocamos o nome da vari�vel, escolhemos o seu tipo de dado e a sua A��o (Figura 35).

**Figura 35.** Cria��o de Vari�veis no ODI.

Para a op��o A��o, temos as seguintes op��es:

Historiar: O ODI manter� na aba �Hist�rico� todos os valores que a vari�vel j� recebeu durante as suas execu��es;
Valor mais recente: O ODI manter� na aba �Hist�rico� o �ltimo valor que a vari�vel recebeu durante as suas execu��es;
N�o persistente: O ODI n�o manter� nenhum hist�rico.

A A��o escolhida neste caso � a �N�o persistente�, pois n�o temos a necessidade de manter hist�rico para esta tarefa. Na aba �Atualizando� vamos adicionar um comando DDL que retornar� o valor para a vari�vel, ou seja, o comando � executado no banco de dados e o resultado � atribu�do para a vari�vel. Para este exemplo utilizamos um select simples na tabela �dual� (que retornar� apenas um registro) utilizando a fun��o do ODI <%=odiRef.getSession("SESS_NO")%>, que retornar� o n�mero da sess�o. No combobox �Esquema� escolhemos em qual esquema queremos executar esta DDL, que neste caso � o ORACLE_DESTINO (Figura 36).

Tabela �dual� Oracle: A tabela DUAL � uma pequena tabela no dicion�rio de dados que o Oracle ou qualquer usu�rio pode referenciar para garantir um resultado conhecido. Esta tabela possui apenas uma coluna, chamada DUMMY com apenas uma linha, contendo o valor X. A DUAL � criada automaticamente pelo Oracle, sob o esquema SYS, mas pode ser acessada por outros usu�rios. Sempre que precisamos verificar um resultado conhecido, como a data e hora do servidor ou o valor atual de uma sequence, simplesmente fazemos a consulta referenciando a tabela DUAL. Isto por que toda consulta SQL deve envolver uma tabela, por�m, se utilizarmos qualquer tabela �povoada� nesta consulta, teremos uma s�rie de inconvenientes, como estrat�gia de acesso ou eventual utiliza��o de �ndices, etc.

O teste para verificar se o procedimento foi realizado com sucesso pode ser feito ao clicar no bot�o Renovar. Se a A��o da vari�vel � �Historiar� ou �Valor mais recente�, podemos ver o valor da vari�vel na aba Hist�rico (Figura 37).

DDL (Linguagem de Defini��o de Dados):A DDL permite ao usu�rio definir tabelas novas e elementos associados. A maioria dos bancos de dados de SQL comerciais t�m extens�es propriet�rias no DDL. Os comandos b�sicos da DDL s�o poucos:

CREATE: cria um objeto (uma Tabela, por exemplo) dentro da base de dados;
DROP: apaga um objeto do banco de dados.

Alguns sistemas de banco de dados (Oracle, por exemplo) usam o comando ALTER, que permite ao usu�rio alterar um objeto, por exemplo, adicionando uma coluna a uma tabela existente. Outros comandos DDL: ALTER TABLE, CREATE INDEX, ALTER INDEX, DROP INDEX, CREATE VIEW, DROP VIEW.

Nosso pr�ximo passo � adicionar a vari�vel no pacote e setarmos a mesma para ser executada como demanda inicial, pois queremos ter o n�mero da sess�o para gravar no log antes de come�ar o processo de ETL. Quando clicamos sobre a vari�vel, podemos observar as suas propriedades, entre elas o �Tipo�, que pode ser setado de v�rias formas (o �cone no pacote e suas propriedades mudar�o conforme o que for setado). As op��es de Tipo s�o:

Declarar vari�vel: � utilizado para receber um valor passado por par�metro quando executamos um cen�rio compilado;
Avaliar vari�vel: � utilizado para fazer um teste l�gico (=, <>, >, <, etc.) sobre o valor da vari�vel. Se o teste l�gico retornar verdadeiro, o fluxo segue para a pr�xima etapa seguinte ao �xito (flecha verde). Se retornar falso, o fluxo segue a pr�xima etapa ao falhar (flecha vermelha);
Renovar vari�vel: executa o select colocado na aba �Atualizando� da vari�vel, atribuindo o resultado do select � vari�vel (o select deve retornar apenas um valor, ou um erro ocorrer�);
Definir vari�vel: atribui manualmente o valor desejado � vari�vel.

Para o nosso pacote, escolheremos o tipo Renovar vari�vel, pois queremos que a vari�vel contenha o valor retornado do select da aba �Atualizando�. Isto faz com que tenhamos o valor da sess�o do ODI atribu�da a nossa vari�vel, com o objetivo de gravarmos posteriormente no log (Figura 38).

Criando Procedimentos

Para criar Procedimentos no ODI devemos acessar a pasta DW, clicar com o bot�o direito sobre a op��o �Procedimentos� e depois em �Inserir Procedimento� (Figura 39).

**Figura 39.** Inserindo novo procedimento.

Na aba �Defini��o� devemos apenas colocar o nome do nosso Procedimento. J� na aba �Detalhes�, devemos clicar no primeiro bot�o �Adicionar� na parte superior. Ap�s este passo ser� aberta uma janela onde deve ser inserido o comando que queremos que este Procedimento execute. Percebemos aqui o n�vel de flexibilidade de trabalhar com o ODI. Nesta tela que foi apresentada � poss�vel adicionar qualquer tipo de comando de qualquer tipo de tecnologia suportada pelo ODI, entre elas Oracle, Java, DBase, Hyperion Essbase, Java Script, entre outros.

A lista completa de tecnologias suportadas pode ser vista no combobox �Tecnologia�. Para este exemplo, faremos apenas um simples insert em uma tabela, mas as possibilidades s�o muito maiores, podendo ter blocos inteiros de PL/SQL com uma l�gica muito mais complexa, tudo dependendo da necessidade do projeto.

Portanto, escolhemos a tecnologia Oracle, o esquema ORACLE_DESTINO (onde est� a tabela de log) e escrevemos o comando a ser realizado, conforme a Figura 40.

**Figura 40.** Criando novo Procedimento.

Notamos alguns detalhes diferentes neste procedimento:

<%=odiRef.getSchemaName( )%>: Fun��o que retorna o nome do esquema do banco de dados referente ao esquema l�gico escolhido (ORACLE_DESTINO). Isso se faz necess�rio pois podemos ter nomes de esquemas diferentes em contextos diferentes. Em desenvolvimento podemos ter ORACLE_DESTINO e em produ��o podemos ter ORACLE_DESTINO_PROD. Assim, n�o podemos deixar o nome do esquema fixo, pois em produ��o geraria um erro;
#SESSAO_ODI: Nome da vari�vel que criamos que conter� o n�mero da sess�o do ODI, prefixada com #. No momento de execu��o, a ferramenta procurar� e substituir� as vari�veis que ele encontrar no c�digo pelo seu valor no momento da execu��o. Devemos ter apenas cuidado para que a vari�vel contenha algum valor, caso contr�rio um erro ser� gerado.

Podemos clicar em OK para fechar esta janela (Figura 40). Observe que poder�amos incluir quantos comandos fossem necess�rios, bastando apenas clicar no bot�o �Adicionar�. Poder�amos inclusive executar comandos de N tecnologias diferentes em ordem seq�encial.

Nossa pr�xima tarefa � realizar a inclus�o de outro procedimento. Para criar procedimentos no ODI devemos acessar novamente a pasta DW, clicar com o bot�o direito sobre a op��o �Procedimentos� e clicar em �Inserir Procedimento�. Para esta estrutura basta nome�-la e clicar em OK, pois iremos inserir uma nova Op��o para este Procedimento.Op��es s�o par�metros que s�o repassados para o Procedimento. Para inserirmos uma Op��o clicamos com o bot�o direito sobre o Procedimento e em seguida �Inserir Op��o�.

Ser� inserida uma Op��o para indicar ao Procedimento se desejamos gravar uma mensagem de sucesso ou erro. Uma Op��o pode ser de tr�s tipos:

Marcar Caixa: Op��o do tipo checkbox, onde � poss�vel escolher entre as op��es SIM/N�O;
Valor: Recebe um valor alfanum�rico com capacidade m�xima de 250 caracteres;
Texto: Recebe um valor alfanum�rico com capacidade ilimitada. O acesso a este tipo de op��o � mais lenta do que o tipo Valor.

Escolheremos o tipo �Valor� (ver Figura 41).

Vamos abrir novamente o procedimento, agora para criar um comando. Escolhemos neste sentido a tecnologia Oracle, o esquema ORACLE_DESTINO e digitamos o comando conforme a Figura 42. Este comando far� com que a tabela de log seja atualizada com uma mensagem de Erro ou de Sucesso, conforme o par�metro passado para ele.

**Figura 42.** Procedimento para gravar detalhes em LOG.

Neste comando temos o <%=odiRef.getOption("STATUS")%> que ir� buscar o valor passado para o par�metro atrav�s da Op��o que criamos no passo anterior. Clicamos em OK e vamos inserir os Procedimentos no nosso fluxo do pacote.

Na Figura 43 visualizamos o Fluxo de nossa carga.

A leitura deste Fluxo pode ser feita desta forma:

1- Comece executando a atualiza��o da vari�vel SESSAO_ODI;

2- Insira um registro na tabela de LOG;

3- Execute as cinco interfaces e grave o status final na tabela do LOG;

4- Se algum procedimento der errado (flechas vermelhas), grave no LOG o status de erro.

As flechas verdes indicam o fluxo sem erros no pacote. As flechas vermelhas indicam o fluxo a ser tomado se algum erro ocorrer.

Para incluir as flechas vermelhas, clique no bot�o �ko� na barra superior, clique no objeto origem e arraste para o objeto destino. Para as flechas verdes, funciona da mesma forma, mas selecionando o bot�o �ok�. A �ltima tarefa necess�ria para execu��o do pacote � setar a Op��o de cada procedimento de Update conforme a sua finalidade. Temos, portanto dois procedimentos, um que registrar� as mensagens de erro e outro as mensagens de sucesso. Clicando no Procedimento que ir� gravar a mensagem de erro (UPDATE_LOG_pr), vamos na aba �Op��es� para inserir o valor de STATUS que este Procedimento deve receber quando for executado, que neste caso � �E� (ERRO) (Figura 44).

**Figura 44.** Setando o Status do procedimento de erro.

Seguiremos os mesmos passos para outro procedimento (tamb�m UPDATE_LOG_pr), onde adicionamos o STATUS para �S� (SUCESSO). Pronto, agora podemos executar o nosso pacote clicando no bot�o Executar na parte inferior da tela.

Executando um Pacote

Executando uma carga com sucesso (Figura 45) podemos notar na nossa tabela de log (LOG_CARGA) o seguinte registro: �A CARGA DA SESSAO 77001 TERMINOU COM SUCESSO!�

Neste ponto podemos simular um erro para verificar a diferen�a com o processo de carga anterior. Para esta simula��o vamos dropar a tabela FATO_VENDAS do banco de destino. Executando o cen�rio observamos que o fluxo foi desviado para o procedimento de LOG e foi gravado o seguinte registro (Figura 46): �A CARGA DA SESSAO 79001 TERMINOU COM ERRO! VEJA OPERATOR PARA MAIS DETALHES.�

**Figura 46.** Execu��o com erro do pacote.

Percebe-se que existe uma diferen�a entre a Figura 45, que teve a execu��o da carga aplicada com sucesso e a Figura 46 que resultou em erro.

Gerando um Cen�rio

Agora que temos nosso pacote completo, falta apenas criar um cen�rio, que nada mais � do que a vers�o �compilada� do pacote. � este cen�rio que ser� mandado para outros ambientes (testes, produ��o, etc.) e que ser� utilizado para rodar as cargas. Para gerar um cen�rio, basta clicar com o bot�o direito sobre o pacote e depois em �Gerar cen�rio� (Figura 47).

Quando geramos um cen�rio, temos a op��o de colocar uma vers�o para o mesmo e tamb�m a op��o de dizer quais s�o as vari�veis que o cen�rio receber� de entrada. Neste exemplo n�o temos vari�veis de entrada, logo, podemos desmarc�-las.

Pronto! Temos nosso cen�rio criado, como pode ser visto na Figura 48.

Este cen�rio funciona como qualquer programa compilado, onde n�o sofre mais altera��es. � poss�vel ent�o fazer modifica��es nas nossas interfaces, modificar o fluxo do pacote, etc., por�m este cen�rio continuar� com a vers�o compilada anteriormente. Podemos, no entanto, recriar o cen�rio para refletir as modifica��es que por ventura foram realizadas, bastando para isso clicar com o bot�o direito sobre o cen�rio gerado e escolher a op��o �Regenerar...�.

Conclus�o

Vimos neste artigo a facilidade e a versatilidade do ODI para construir processos de ETL. Sem muito esfor�o, conseguimos integrar diferentes origens de dados (Oracle, Firebird e arquivo texto) para um destino �nico Oracle. Fora a facilidade de se trabalhar com uma ferramenta visual, vimos que os M�dulos de Conhecimento (KMs) nos facilitam a manuten��o e a padroniza��o dos c�digos, tornando assim o ODI uma grande ferramenta para o desenvolvimento dos processos de ETL.

Links

PRODUCT ORACLE: The Official Site
www.oracle.com/products/middleware/odi/oracle-data-integrator.html

TECNOLOGIAS ODI: The Official Site
www.oracle.com/technology/software/products/odi/index.html

Confira outros conte�dos:

Por Rodrigo Em 2009

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

M�rcio Silva

�timo artigo. Elucida muito bem o que � e como funciona a ferramenta. Complementando com um �timo passo a passo para desenvolver uma carga de dados.

Parab�ns!

há +1 ano

M�todo para iniciantes

sem base nenhuma

Mentorias individuais

quando voc� travar

+40 projetos reais

para o seu portf�lio

+5000 exerc�cios

para fixar o conte�do

Suporte IA

que te ensina

No code e automa��es

pra entregar mais r�pido

Veja os resultado dos nossos alunos

Conquistas reais de quem est� aplicando o m�todo

Conhecer Planos

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Artigo SQL Magazine 68 - Desvendando o Oracle Data Integrator

Uso da ferramenta Oracle Data Integrator (ODI) para a constru��o de processos ETL (Extract, Transform, Load). Neste artigo, utilizaremos o ODI para integrar dados de diferentes origens (SGBD Oracle, Firebird e arquivo texto) para uma base de destino Oracle.

Iniciando o desenvolvimento

Construindo a Estrutura do Projeto � Modelos de Dados

Inserindo o Modelo de Dados Oracle � Origem

Inserindo o Modelo de Dados Firebird � Origem

Inserindo o Modelo de Dados File � Origem

Inserindo o Modelo de Dados Oracle � Destino

Iniciando o Desenvolvimento das Interfaces

Desenvolvimento da Interface � Carga Destino DIM_CLIENTE

Desenvolvimento da Interface � Carga Destino DIM_PRODUTO

Desenvolvimento da Interface � Carga Destino DIM_VENDEDORES

Desenvolvimento da Interface � Carga Destino DIM_TEMPO

Desenvolvimento da Interface � Carga Destino FATO_VENDAS

Desenvolvimento do Pacote para Carga de Dados

Criando Vari�veis

Criando Procedimentos

Executando um Pacote

Gerando um Cen�rio

Conclus�o

Confira outros conte�dos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para come�ar a atuar como programador?

Por que a programa��o se tornou a profiss�o mais promissora da atualidade?

Quais s�o os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programa��o atrav�s da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem hor�rio para as aulas?

Por que a DevMedia n�o usa videoaulas em sua did�tica?

Preciso de um computador espec�fico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais s�o os planos de assinatura dispon�veis?

Adquirindo o plano, terei acesso a todo o conte�do?

A plataforma tem planos vital�cios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

Como excluir meus dados da plataforma?