Perigos e Armadilhas do Particionamento

Perigos e Armadilhas do Particionamento - Etapa 2 � Parte 01

por Arup Nanda

Chaves de Partiç�o Multi-colunadas (Multi-Column Partition Keys)

A maioria dos documentos, artigos, livros e outras publicaç�es, falam sobre o uso de uma �nica coluna para chave de particionamento, mas que tal usar duas ou mais colunas? Definitivamente � poss�vel, mas em tal caso, como dever�amos proceder?

Muitas pessoas t�m a impress�o de que especificando mais de uma coluna como chave de particionamento cria-se uma tabela particionada multidimensional. Por exemplo, se voc� tem uma tabela chamada "faixa de empregado" particionada em (DEPTNO, ZIPCODE), isso significa que s�o avaliados os valores de ambas as colunas quando se est� decidindo sobre a colocaç�o da linha em uma partiç�o?
Infelizmente, a resposta � n�o.

A segunda coluna na chave de particionamento s� � usada em alguns casos especiais. Ambos os valores n�o precisam ser satisfeitos para uma linha ir para uma partiç�o espec�fica. A primeira coluna � avaliada antes; se satisfizer a condiç�o, ent�o a segunda coluna n�o � avaliada. Por�m, se o primeiro valor da coluna n�o for totalmente satisfat�rio, a pr�xima coluna � considerada.

Isto ser� mais bem entendido talvez utilizando-se um exemplo. Considere o seguinte:

create table ptab1

  col1 number(10),
  col2 number(10),
  col3 varchar2(20)
)
partition by range (col1, col2)
(
partition p1 values less than (101, 101),
partition p2 values less than (201, 201)
)

� uma percepç�o popular que quando uma linha � inserida, se ambos os valores de col1 e col2 s�o menores que 101, ent�o v�o para a partiç�o P1; se os valores s�o menores que 201, por�m maiores ou igual a 101, v�o para a partiç�o P2; caso contr�rio, v�o para a partiç�o PM. Em nosso exemplo, vejamos para qual partiç�o ser�o direcionados. Aqui est�o todas as linhas da tabela:

select * from ptab1;

    COL1      COL2COL3

--------- ---------- ------

    100100        rec1

    102102        rec2

    100102    rec3

    102100    rec4

    101100    rec5

    101101        rec6

    101102        rec7

    201100    rec8

    201101    rec9

    201102     rec10

Em quais partiç�es os registros ser�o inseridos? Confiramos o primeiro:

select * from ptab1 partition (p1);

   COL1    COL2     COL3

---------- ---------- ------

   100   100   rec1

   100102        rec3

   101100        rec5

O registro REC1 est� na partiç�o P1, como esperado. Mas REC3 deveria estar na partiç�o P1? O valor da coluna COL1, que � 100, � menor que 101 e ent�o satisfaz a condiç�o. Por�m COL2 tem 102, e � maior que 101, o valor de limite de COL2. Como � que COL2 foi para a partiç�o P1? A raz�o � bastante simples: P1 � a primeira partiç�o, o valor � avaliado pela primeira coluna (COL1) e satisfaz, assim o valor da coluna COL2 n�o � nem mesmo avaliado. O registro vai para P1, embora o crit�rio de COL2 n�o seja satisfeito.

Assim, se a segunda coluna, COL2, n�o � nem mesmo considerado em alguns casos, onde entraria em jogo e por que seria definido assim? Considere o registro REC5 no qual o valor de COL1 � 101, para a chave de particionamento � um valor incerto daquela coluna. Mas neste caso, � considerada a segunda coluna. Neste caso, o valor de COL2 � 100, menor que o valor de limite de COL2 na chave de particionamento (101); ent�o, entra na partiç�o P1. Veja os registros na partiç�o P2.

select * from ptab1 partition (p2);

  COL1         COL2      COL3

---------- ---------- -----

   102102 rec2

   102100 rec4

   101101 rec6

   101102 rec7

   201100 rec8

   201101 rec9

   201102 rec10

Os registros REC2, REC4, e REC7 satisfazem as colunas e s�o, como esperado, inseridos na partiç�o P2. Por�m, para REC6, o valor de COL1 � 101, que � o valor limite para a primeira coluna da chave de particionamento. Assim, REC6 cai na consideraç�o especial para chaves de particionamento multi-colunados. Porque o valor 101 de COL2 � maior que o valor limite da coluna COL2 da partiç�o P1 (101), as linhas foram para a partiç�o P2.

Pela mesma l�gica, para os registros REC8, REC9 e REC10, o valor de COL1 � 201 exatamente no limite para o valor daquela coluna na chave de particionamento. Por�m, o valor de COL2 � menor que 201 e o valor limite daquela coluna em P2. Ent�o, as linhas foram para a partiç�o P2.

O que acontece quando voc� insere uma linha com COL1 = 201 e COL2 = 201?

Esta linha entrar� na partiç�o PM, desde que ambas as colunas n�o podem estar fora dos limites. Esquematicamente, a decis�o para inserir em uma partiç�o pode ser explicada pela figura abaixo.

Ent�o o que acontece no caso da lista de particionamento no Oracle 9i, onde n�o h� nenhum conceito de uma faixa e, portanto, n�o h� nenhum valor de limite? Felizmente, a lista de particionamento n�o permite colunas m�ltiplas, assim esta situaç�o n�o surge.

Aparentemente, considerando a confus�o potencial sobre a colocaç�o de linhas em partiç�es, n�o vale a pena o uso de chaves de particionamento multi-colunadas. Por�m, em alguns casos especiais, pode ser muito �til. Por exemplo, considere uma tabela chamada SALES com colunas SALES_YEAR, SALES_MONTH e SALES_DAY, em vez de uma �nica coluna chamada SALES_DATE. Isto � �til em alguma implementaç�o de projeto de datawarehouse para habilitar dimens�es e hierarquias. Em tal caso, voc� poderia usar uma chave de particionamento em todas as tr�s colunas para efetivamente projetar as partiç�es.

Armadilha potencial: Tenha cuidado quando for definir colunas m�ltiplas como chave de particionamento. Se tiver que faze-lo, use casos de teste precisamente em torno dos valores limite.

Perigos e Armadilhas do Particionamento - Etapa 2 � Parte 01

Neste artigo conheceremos perigos e armadilhas do particionamento.

Artigos relacionados