Por que eu devo ler este artigo:Este artigo apresenta o Netezza, sistema de hardware/software pré-configurado da IBM desenvolvido para garantir que clientes de Data Warehouse possam receber os dados armazenados com alto desempenho.

Esse artigo é útil para pessoas que desejam obter o melhor desempenho de sistemas de data warehouse.

Para isso, conheceremos melhor o Netezza, seus componentes e principais dispositivos, entendendo como podemos melhorar nossas consultas, utilizando da melhor forma possível o hardware disponível.

O sistema Netezza foi desenvolvido em 1999 pela empresa Netezza, inicialmente para concorrer com sistemas data warehouse existentes.

Ele é composto por um conjunto de hardware e software projetados para melhorar o desempenho de consultas SQL em sistemas data warehouse, retornando uma grande quantidade de dados em um curto espaço de tempo.

Em 2010, a IBM comprou a Netezza e começou a desenvolver e suportar esse sistema, adicionando-o à estrutura IBM PureSystems. Assim, o IBM PureData Systems for Analytics é construído sobre o sistema Netezza.

Na Figura 1 vemos que o sistema Netezza é composto por um conjunto de gabinetes de discos (a quantidade de discos muda de acordo com o sistema adquirido), que são gerenciados por servidores Snippet Blades, também conhecidos como S-Blades.

Estes são responsáveis por processamento das consultas que serão retornadas aos servidores, que funcionam como interface entre as aplicações e os dados armazenados no sistema Netezza.

Figura 1. Estrutura física do sistema Netezza

O IBM PureData for Analytics, na versão N3001, pode ser adquirido nas configurações:

· N3001-002: possui dois servidores S-Blade ativos, e vem com 40 CPU Cores, 32 FGPA Cores, e 32TB para armazenamento de dados (considerando uma compressão de 4x);

· N3001-005: possui quatro servidores S-Blade ativos, 80 CPU Cores, 64 FPGA Cores e 96TB para armazenamento de dados (considerando uma compressão de 4x);

· N3001-010: possui sete servidores S-Blade ativos, 140 CPU Cores, 112 FPGA Cores e 192TB para armazenamento de dados (considerando uma compressão de 4x).

As configurações são para apenas um Rack Netezza, mas podemos ter configurações com até oito racks interligados, sempre multiplicando a capacidade do N3001-010 pela quantidade de racks. As opções disponíveis são: N3001-020 com dois racks, N3001-40 com quatro racks e N3001-80 com oito racks.

Compreendendo os servidores S-Blades

Os servidores S-Blades, ou apenas SPA (Snippet Process Array), são blades utilizadas para processamento das requisições enviadas aos bancos de dados. Cada SPA contém uma SPU (Snippet Process Unit), composta por FPGA, CPU e memória e é associada com uma determinada quantidade de discos de armazenamento.

Para melhorar o desempenho das consultas, todo o processamento é dividido entre a FPGA e a CPU. Elas são responsáveis por:

· FPGA (Field Programmable Gate Array): esse componente é responsável por filtrar ...

Quer ler esse conteúdo completo? Tenha acesso completo