Do que se trata o artigo:

Neste artigo veremos as principais funcionalidades de Data Warehousing presentes no SQL Server 2008. Veremos ainda quais soluções devemos utilizar caso o volume de dados seja muito grande, ou com previsão de crescimento.

Para que serve:

Garantir que um ambiente de Data Warehousing seja construído utilizando as melhores práticas disponíveis ajuda a responder de forma ágil às necessidades das áreas de negócio.

Em que situação o tema útil:

A construção e manutenção de ambientes de Data Warehousing é cercada de desafios. Com a utilização de técnicas especializadas, a implementação se tornará eficiente, com maior garantia na qualidade dos dados apresentados e de forma a atender um grande número de usuários simultâneos.

Um assunto bastante comum em grandes empresas hoje, no que diz respeito ao gerenciamento de dados, é a criação ou evolução de ambientes de Data Warehousing. Habilitar as áreas de negócio a terem informações a sua disposição para tomada de decisão baseando-se em dados alimentados em tempo real deixou de ser um diferencial e passou a ser uma obrigação. Por outro lado, desenvolver uma solução madura a fim de se endereçar tal necessidade requer conhecimentos que vão além das habilidades comuns de um DBA.

Neste artigo vamos nos concentrar nas funcionalidades do SQL Server que ajudam a melhorar os processos de carga, administração e apresentação dos dados em um Data Warehouse, além de alguns ajustes básicos que visam à melhoria no desempenho. Vamos entender também qual a visão da Microsoft para Data Warehousing e quais as ofertas baseadas em appliance.

A Visão da Microsoft

O desenvolvimento de todo produto passa por alguns estágios que são chave ao se decidir o caminho que tal produto deve seguir: retorno de clientes, melhorias na implementação sobre a versão atual e pesquisas de mercado, que indicam a direção para qual a indústria está remando.

O SQL Server traz, já há algum tempo, diversas funcionalidades que são direcionadas a necessidades comuns de Data Warehouses (como particionamento de tabelas e índices, por exemplo), mas muito investimento foi feito também para que o SQL Server 2008 trouxesse outras novidades, como compressão de dados e change data capture, dos quais iremos falar mais adiante neste artigo. Entre tais funcionalidades, quais as empresas realmente precisam e o que as ajudaria a serem mais ágeis na construção de ambientes de banco de dados grandes, em especial para Data Warehousing?

De acordo com a pesquisa do TDWI (The Data Warehousing Institute), o volume de dados em Data Warehouses tende a crescer drasticamente nos próximos três anos. Embora hoje apenas 17% das empresas pesquisadas tenham mais de 10TB em ambientes de DW, 34% delas indicaram que seu volume de dados deve crescer para este volume nos próximos três anos. Na mesma pesquisa, 57% das empresas indicaram que os custos em projetos de Data Warehouse deverão ser reduzidos, por consequência da recente crise econômica mundial. Outra informação importante desta pesquisa é o fato de que embora 17% das empresas pesquisadas indicarem que utilizam ambientes de Data Warehouse em tempo real hoje, 92% delas indicaram que irão utilizar este tipo de ambiente para decisões em tempo real. Em resumo, nossos desafios como administradores de dados nos próximos três anos giram em torno de gerenciar um volume muito maior de dados, com custos menores, disponíveis de forma mais ágil e com menor tempo de indisponibilidade. Baseado nestas informações, vamos entender as opções para se construir Data Warehouses de forma mais rápida, eficiente e com custos reduzidos.

A visão da Microsoft para Data Warehousing gira em torno de três pilares: SQL Server 2008 R2, o Fast Track Data Warehouse e a nova oferta de Data Warehouse baseada em appliance da Microsoft, o Parallel Data Warehouse. Tais pilares habilitam as empresas a montarem ambientes de Data Warehousing que podem ir de poucos gigabytes até centenas de terabytes. Vamos explorar melhor estes três pilares que compõem a visão da Microsoft e entender qual é a melhor opção para cada caso.

Processos de carga com SQL Server 2008 R2

O SQL Server 2008 R2 é um produto que, fora da caixa, entrega funcionalidades que são relevantes para ambientes de Data Warehousing. No entanto, precisamos entender melhor algumas características chave na adoção de uma solução para esta finalidade: carga, administração e consumo dos dados.

...
Quer ler esse conteúdo completo? Tenha acesso completo