SGBD relacionais orientados a coluna: uma nova roupagem ao Data Warehousing – Parte 02

Desempenho das Operações de Leituras


As modificações propostas pelos SGBD Orientado a Coluna, como já fora mencionado, incidem no desempenho deste em relação ao seu co-irmão orientado a linha. Analisando os resultados do benchmark TPC-H, observa-se que os representantes daquele obtiveram desempenho superior a esse para bases de dados com volumes representativos.

 

Conforme ilustrado no quadro abaixo, considerando bases de dados de até 3 Terabytes – Tb –, os SGBD Orientado a Coluna, para as operações de consultas, atingiram um desempenho 14 vezes maior que os tradicionais e com custos 5 vezes menor. Para volumes na casa dos 10 Tb somente foram identificados métricas para os SGBD tradicionais.

Quadro 2 – Benchmark entre soluções baseadas em SGBD Orientado a Coluna e Linha (adaptado TPC-H)

sqlmagazine-18-12pic06.JPG 


Onde:

QphH Query-per-Hour Performance Metric

P/Q     – Representa o custo do Hardware/Software/Manutenção por QphH

 

O TPC-H é uma métrica de referência de desempenho, padrão de mercado, que  mensura o comportamento de sistemas de suporte à decisão frente à aplicação de um grupo de consultas ad-hoc de alta complexidade e operações de modificação sobre os dados – relevantes a algum segmento do mercado – concorrentemente.

Conclusão

A ênfase dada na manipulação das colunas em detrimento das linhas, por parte dos SGBD Orientado a Coluna, revela uma interessante interpretação e, naturalmente,  introdução de inovações à tecnologia relacional – definida por Codd na década de 70 – para  prover alto desempenho nas operações analíticas. Trata-se, portanto, um apoio adicional as organizações desafiadas a retirar valor dos seus respectivos montantes de dados armazenados.

 

Tais SGBD, no momento, detêm uma pequena parcela deste concorrido mercado – cerca de 10% contra os quase 70% de Oracle e IBM (MULLINS, 2007) – na qual seus participantes duelam em diferentes campos considerados estratégicos, como o maior suporte a Data Warehousing. Apesar de este constituir o cerne dos SGBD Orientado a Coluna e de existirem soluções representativas de sua aplicação – como o BigTable na Google e o Sybase IQ na Orbitall –, o crescimento no uso desta tecnologia depende de inúmeros fatores que dificultam qualquer prognóstico.

 

Por fim, cumpre alertar que a aquisição desta tecnologia não deve ser conduzida de forma independente, pois esta denota um dos componentes de uma arquitetura de BI cuja definição dependente do julgamento e balanceamento de requisitos de curto e longo prazo do negócio.

Referências bibliográficas

BURNS, Ricky. “The vertica database: rethinking data warehouse architecture”, 2007. Acessado em http://www.wintercorp.com/whitepapers/whitepapers.asp em 10/10/2008.

 

CHANG, Fay et al. “BigTable: a distributed storage system for structured data”, OSDI,  2006.

 

MULLINS, Craig S. “The database repost – July 2007”, 2007. Acessado em http://www.tdan.com em 10/10/2008.

 

STONEBRAKER, Mike et al. “C-store: a column oriented dbms”, Proceedings of 31st VLDB, Noruega, 2005.

Referências Sites

SYBASE. http://www.sybase.com/products/databaseservers/sybaseiq

 

TPC-H. http://www.tpc.org/tpch/results/tpch_perf_results.asp