Particionamento no Oracle

Demais posts desta s�rie:
Particionamento no Oracle � Parte 2

Artigo no estilo: Curso

De que se trata o artigo?

Este artigo apresenta t�cnicas de particionamento de objetos no banco de dados para garantir melhor performance e gerenciamento de informa��es em ambientes que apresentam tabelas gigantescas ou menos em ambientes menores, mas que se beneficiam da estrutura do particionamento.

Em que situa��o o tema � �til?

O particionamento de dados se mostra uma funcionalidade muito atraente e bem aceita em situa��es em que se precisem armazenar grandes volumes de dados em uma mesma tabela ou se deseje gerenciar o ciclo de vida de determinadas informa��es. Assim, o tema discutido neste artigo � �til em situa��es onde � necess�rio dividir grandes volumes de dados ou mesmo prover um gerenciamento descentralizado das informa��es, separando as informa��es armazenadas no banco de dados de uma maneira mais eficiente e perform�tica.

Resumo DevMan

O barateamento de dispositivos de armazenamento aliados a quest�es legais (no sentido de regulamenta��es) e tamb�m a crescente necessidade de armazenamento de arquivos bin�rios, como planilhas, documentos de texto, fotos, v�deos, etc., tem sobrecarregado a cada dia os bandos de dados das corpora��es. Esta demanda for�a as empresas que desenvolvem Sistemas de Gerenciamento de Bancos de Dados a implementarem solu��es que atendam as necessidades de armazenamento, por�m oferecendo �timo desempenho na consulta a esses dados.

Pensando justamente nesta necessidade a Oracle oferece, j� h� bastante tempo, uma solu��o realmente muito boa, que atende a exatamente todas essas necessidades. Trata-se do particionamento de objetos.

Atrav�s desta funcionalidade o DBA poder� prover � aplica��o uma solu��o de baix�ssimo custo (j� � uma funcionalidade presente na vers�o Enterprise Edition do banco de dados Oracle sem custo adicional), sem a necessidade de altera��es de c�digo e que oferece um desempenho realmente impressionante.

A versatilidade oferecida pela solu��o realmente impressiona, permitindo que parti��es sejam criadas com base em um intervalo de dados (que podem ser valores num�ricos ou mesmo datas) ou uma lista de valores (estados da federa��o, por exemplo) ou ainda atrav�s de um algoritmo de particionamento e, como se n�o bastasse, at� mesmo baseado na combina��o destas estrat�gias.

O melhor de tudo � que toda essa implementa��o � totalmente transparente para a camada de aplica��o e os ganhos de desempenho s�o realmente consider�veis.

� importante destacar que esta funcionalidade n�o est� limitada apenas a situa��es onde existam tabelas gigantescas (como ambientes de Data Warehouse, por exemplo), mas se adaptam perfeitamente a situa��es em que seja necess�rio gerenciar o ciclo de vida das informa��es ou at� mesmo �organizar� melhor a forma em que os dados estejam armazenados nas tabelas.

Sem a menor sombra de d�vidas o particionamento (tanto de tabelas quanto de �ndices) � uma solu��o muito inteligente para auxiliar no ganho de performance geral das aplica��es que acessam o banco de dados.

O particionamento permite decompor tabelas muito grandes e �ndices em partes menores e mais gerenci�veis que chamamos simplesmente de parti��es. Cada parti��o � um objeto independente, com seu pr�prio nome e, opcionalmente, as suas caracter�sticas pr�prias de armazenamento.

Para uma analogia que ilustra o particionamento, suponha que um gerente de RH tenha uma grande caixa que cont�m pastas de funcion�rios. Cada pasta lista a data de contrata��o do empregado. As consultas s�o feitas frequentemente para os funcion�rios contratados em um determinado m�s. Uma maneira para satisfazer este tipo de consulta � o de criar um �ndice na coluna �data de contrata��o� do funcion�rio que especifica os locais das pastas espalhadas por toda a caixa. Em contrapartida, uma estrat�gia de particionamento usa muitas caixas menores, com cada caixa contendo pastas para os empregados admitidos em um determinado m�s.

Utilizar caixas menores nos traz v�rias vantagens. Quando precisamos das pastas dos empregados contratados em junho, o gerente de RH pode pegar apenas a caixa de junho. Al�m disso, se qualquer uma das caixas menores estiver temporariamente danificada, as outras caixas menores continuam dispon�veis. Mudan�as no escrit�rio tamb�m se tornam mais f�ceis, porque em vez de mover uma �nica caixa enorme e pesada, o gerente pode mover v�rias caixas pequenas.

Do ponto de vista de uma aplica��o, haver� apenas um �nico objeto no esquema para ser consultado. N�o h� necessidade alguma de mudan�a no c�digo da aplica��o ou nas consultas DML (ver Nota do DevMan 1) para acessar as tabelas particionadas.

Nota do DevMan 1: DML - Data Manipulation Language

Uma linguagem de manipula��o de dados (DML � Data Manipulation Language) � uma fam�lia de elementos de sintaxe semelhantes a uma linguagem de programa��o de computador utilizado para inserir, excluir e atualizar dados em um banco de dados. A linguagem de manipula��o de dados mais conhecida � a SQL - Structured Query Language, que � usada para recuperar e manipular dados em um banco de dados relacional.

DML s�o os comandos SQL de altera��o de dados, que modificam os dados armazenados mas n�o alteram os esquemas ou objetos do banco de dados. Manipula��o de objetos persistentes do banco de dados como, por exemplo, tabelas ou procedimentos armazenados (stored procedures), atrav�s de comandos SQL, � considerada como sendo parte de linguagem de defini��o de dados ou DDL (Data Definition Language). Na SQL estas duas categorias s�o similares em sua sintaxe, tipos de dados, express�es, etc, mas distintas em sua fun��o.

Linguagens de manipula��o de dados t�m sua funcionalidade organizada pela palavra inicial do comando, que � quase sempre um verbo. No caso de SQL, estes verbos s�o:

SELECT ... FROM ... WHERE ...
   INSERT INTO ... VALUES ...
   UPDATE ... SET ... WHERE ...
   DELETE FROM ... WHERE ...

Uma consulta SELECT � classificada como "SQL-data" (conforme o padr�o ANSI SQL 92, em sua se��o 4.22.2) e por isso � considerada como padr�o de sa�da de DML. A instru��o SELECT ... INTO � considerada DML porque manipula (modifica) os dados. Na pr�tica, no entanto, esta distin��o n�o � feita e a instru��o SELECT � amplamente considerada como parte da DML.

A maioria dos Sistemas de Gerenciamento de Banco de Dados Relacionais implementa uma extens�o da linguagem SQL atrav�s de programa��o imperativa, ou seja, linguagens procedurais. Exemplos desta implementa��o s�o o PLSQL do Oracle, o SQL PL do DB2 ou ainda o Transact-SQL do SQL Server.

DMLs tendem a ter v�rias capacidades, conforme o fornecedor de banco de dados. Existe um grande esfor�o para estabelecer normas de padroniza��o atrav�s do padr�o SQL ANSI, mas os fornecedores de SGBDRs ainda oferecem suas pr�prias extens�es para o padr�o.

As DMLs s�o divididas em dois tipos: programa��o procedural e programa��o declarativa. Cada instru��o SQL DML � um comando declarativo. As instru��es SQL individuais s�o declarativas, em oposi��o ao imperativo (procedural), pelo fato de que descrevem a finalidade do programa em vez de descrever o procedimento para realizar determinada tarefa.

O particionamento se mostra muito �til para os mais variados tipos de aplica��es, em especial as que administram grandes volumes de dados.

Podemos listar como principais benef�cios:

� Aumento da disponibilidade: A indisponibilidade de uma parti��o n�o implica a indisponibilidade de todo o objeto. O otimizador de consulta (query optimizer � ver Nota do DevMan 2) automaticamente remove do plano de execu��o (execution plan � ver Nota do DevMan 3) as parti��es sem refer�ncia e, com isso, as consultas n�o s�o afetadas quando as parti��es n�o est�o dispon�veis;

Nota do DevMan 2: Otimizador de Consultas � Query Optimizer

O otimizador de consulta � o componente de um Sistema de Gerenciamento de Banco de Dados (SGBD) que tenta determinar a forma mais eficiente de executar uma consulta. O otimizador considera os planos de consulta poss�veis para uma determinada consulta e tenta determinar qual desses planos ser� o mais eficiente.

Otimizadores de consulta baseados em custos (cost based optimizer) atribuem um "custo" estimado para cada plano de consulta poss�vel, e escolhe o plano com o menor custo. Os custos s�o utilizados para estimar o custo de tempo de execu��o para retornar uma consulta em termos do n�mero de opera��es de I/O (Input/Output � Entrada/Sa�da) necess�rios, os requisitos de CPU e de outros factores determinados a partir do dicion�rio de dados. O conjunto de planos de consulta examinados � formado atrav�s da an�lise dos poss�veis caminhos de acesso (Access Path) (por exemplo, utiliza��o de �ndice ou varredura sequencial � Full Table Scan) e ainda algoritmos de jun��o (por exemplo sort-merge join, hash join, loop aninhado). O tempo de busca pode se tornar muito grande, dependendo da complexidade da consulta SQL.

...

Quer ler esse conteúdo completo? Tenha acesso completo