De que trata o artigo?

Este artigo apresenta o Talend Open Studio, uma ferramenta Open Source para ETL e Integração de Dados que gera código Java ou Perl, considerada uma alternativa às opções pagas existentes no mercado. Possui componentes específicos para conexão com os principais bancos de dados, além de outras facilidades como envio de e-mails e acesso a web services. Esta ferramenta está em constante evolução e conta com a opção de suporte pago, além do apoio de uma comunidade.


Para que serve?

As aplicações de Business Intelligence utilizam informações de várias fontes, sendo necessário integrá-las e carregá-las em um Data Warehouse através de um processo conhecido como ETL (Extração, Transformação e Carga). O Talend Open Studio permite desenvolver aplicações de ETL utilizando uma interface gráfica baseada em componentes. Essas aplicações podem ser executadas através da interface, como aplicações independentes ou como web services.


Em que situação o tema é útil?

O Talend Open Studio é extremamente útil para aplicações de ETL e Integração de dados, sua interface visual facilita o desenvolvimento e o fato de ser free e Open Source permite o uso em projetos com baixo orçamento. Sua maturidade permite a utilização em projetos empresariais.

Nos dias de hoje as empresas estruturam seus ambientes de TI incorporando novos sistemas aos legados existentes. Esses novos sistemas geralmente utilizam tecnologias diferentes entre si, tanto nas suas camadas de apresentação e negócio quando em suas bases de dados. Operacionalizar esses ambientes heterogêneos gera uma demanda crescente de integração, pois além das diferentes bases de dados de negócios, armazenadas em SGBDs de diversos fornecedores, também devem ser integradas informações de outras fontes, como arquivos texto, planilhas e web services. Mas as dificuldades não existem apenas no aspecto operacional, unificar essas informações que servem de base para a tomada de decisão através das aplicações de Business torna-se um desafio.

Podemos desenvolver rotinas de integração de dados de várias formas, desde a escrita manual de código utilizando linguagens como Java ou C++ até a utilização de uma das diversas ferramentas proprietárias existentes no mercado. Felizmente esse é um tipo de aplicação para o qual existem opções open source evoluídas o suficiente para seu uso em ambientes de produção. Nessa série de artigos vamos abordar o Talend Open Studio, uma ferramenta que atende aos principais requisitos dos projetos de integração e ETL.

Talend Open Studio

A Talend é uma empresa francesa provedora de produtos de integração de dados open source e seu principal produto é o Talend Open Studio. O Talend Open Studio também é disponibilizado como componente principal do Talend On Demand, uma opção SaaS (software como serviço) da ferramenta; e do Talend Integration Suite, que é um pacote pago de produtos e serviços que inclui capacidades adicionais para desenvolvimento colaborativo e opções de alta performance. O Talend Open Studio é um produto de geração de código, escrito em Java, que utiliza a plataforma RCP do Eclipse, gerando código Java ou Perl. O código gerado pode ser visualizado e executado independentemente de qualquer interface. Isso permite aos desenvolvedores utilizar o conhecimento prévio nessas tecnologias.

Nota do DevMan:

SaaS: Ou “Software as Service”. É uma forma de disponibilização de software através da web, na qual não é necessária nenhuma instalação no cliente. O acesso é on-line e não são adquiridas licenças, apenas paga-se para utilizar como um serviço. O Talend possui essa modalidade de acesso, mas de forma gratuita.

Instalação do Talend Open Studio

Por simplicidade, vamos nos referir ao Talend Open Studio apenas como TOS.

Para executar a ferramenta é necessário ter instalada uma JVM (Java Virtual Machine) 1.5 ou superior. Baixe a versão General Availability mais recente do TOS (no momento da escrita desse artigo é a 3.1.3). Essas versões são estáveis e podem ser utilizadas em produção. As versões Milestone, ainda em desenvolvimento, devem ser utilizadas apenas para testes.

Existem dois pacotes de instalação disponíveis: TOS-ALL-V e TOS-Win32-V. O primeiro é um arquivo compactado (.zip) que contém todos os executáveis e bibliotecas necessários para a execução da ferramenta nos sistemas operacionais Windows 32, Unix e Linux (GTK). Esse pacote não possui um instalador, basta fazer o download no site e descompactá-lo no diretório de sua escolha. Dentro do diretório TOS-ALL-r-V existe o executável TalendOpenStudio-win32-x86.exe que inicia o TOS no Windows, além das versões específicas para cada sistema operacional.

O segundo pacote contém um único arquivo executável, exclusivamente para o Windows, que inicia um instalador, bastando informar o diretório de instalação do TOS. Esse instalador irá descompactar os arquivos necessários e criar um atalho para o TOS no desktop.

Na pagina de downloads da Talend existe um link (Documentation Section) de onde é possível visualizar o Wiki com instruções de instalação e baixar os Guias do Usuário e de Referência dos Componentes.

...
Quer ler esse conteúdo completo? Tenha acesso completo