Armazenando relacionamentos hier�rquicos em db relacionados

Do que se trata o artigo: Estruturas de dados hier�rquicos s�o aquelas que costumam ser visualizadas na forma de �rvore, com liga��es entre n�s pai e seus respectivos n�s filhos. Existem formas bastante interessantes de tratar hierarquias. Como n�o poderia deixar de ser, cada abordagem tem seus custos e benef�cios, e esses s�o os aspectos que ser�o discutidos neste artigo.
Em que situa��o o tema �til: Estruturas de dados hier�rquicas s�o bastante comuns em sistemas de informa��o, e muitas vezes a equipe de desenvolvimento acaba adotando uma das solu��es convencionais de modelagem sem analisar o impacto dessa decis�o. Este artigo tem por objetivo orientar os projetistas do banco de dados para que uma solu��o adequada seja escolhida.
Resumo DevMan: O artigo trata da modelagem de estruturas de dados hier�rquicas em bancos de dados relacionais. Diversas possibilidades de solu��o s�o apresentadas, desde aquelas baseadas apenas em artif�cios de modelagem at� aquelas que utilizem recursos espec�ficos de SGBDs. Para cada alternativa � feita uma an�lise do custo e benef�cio.
Autores: S�rgio Luis Sardi Mergen e Holisson Soares da Cunha

Relacionado: Curso de Administra��o de Banco de Dados com SQL Server

� bastante comum se deparar com a necessidade de armazenar dados hier�rquicos em um sistema de informa��o. Esses dados s�o aqueles que costumam ser visualizados na forma de �rvore, com liga��es entre n�s pai e seus respectivos n�s filhos. Alguns exemplos t�picos incluem composi��o de produtos (Bill of Materials � BOM) e rela��es entre chefe/subordinado. �s vezes, at� mesmo a principal entidade de um modelo segue esta estrutura, como � o caso dos sistemas de f�runs com suas mensagens aninhadas.

Quem j� precisou usar bancos de dados relacionais para atender a este tipo de situa��o sabe que a modelagem pode ser intrincada e exigir um certo grau de racioc�nio na defini��o da melhor solu��o. Afinal, trata-se de informa��es dispostas em uma hierarquia, com um n�mero muitas vezes indeterminado de n�veis. Dependendo da solu��o adotada, alguns tipos de consulta podem exigir processamento recursivo, e outras podem at� mesmo ser dif�ceis de formular.

O que muitos n�o sabem � que existem formas bastante interessantes de tratar hierarquias, usando modelos de dados dos mais diversos. Como n�o poderia deixar de ser, cada abordagem tem seus custos e benef�cios, e esses s�o precisamente os aspectos discutidos neste artigo. Divirta-se avan�ando de se��o em se��o, ou como bom projetista de �rvore, pulando de galho em galho.

Aplica��o de exemplo

Para usar um exemplo bem gen�rico e conhecido por todos, escolhemos o problema de modelagem das rela��es de subordina��o. Afinal, dentro de uma corpora��o, infelizmente quase todos t�m um chefe.

A Figura 1 mostra as rela��es de chefia em uma empresa fict�cia. Para come�ar, vamos analisar os componentes representados nesta �rvore. Quando se fala sobre estruturas hier�rquicas, costuma-se utilizar uma nomenclatura pr�pria. Por exemplo, os elementos da �rvore s�o chamados de n�s, ou v�rtices, e as liga��es entre elementos s�o chamadas de arcos.

As rela��es (grau de parentesco) entre os n�s tamb�m recebem nomes. N� pai (parent) � aquele que aparece acima de algum outro n�, enquanto um n� filho (child) aparece abaixo, tanto direta quanto indiretamente. Como j� se pode imaginar, n� irm�o (sibling) � o que possui o mesmo pai direto. Uma �rvore tamb�m � composta por n�veis que indicam a altura dos n�s. Por exemplo, Roger, o Diretor Executivo, est� no primeiro n�vel, enquanto seus subordinados diretos est�o no segundo.

Outro conceito importante que vale a pena destacar � o de caminhamento em �rvores. O caminhamento se refere � ordem em que os n�s s�o acessados. Em �rvores, existem dois tipos b�sicos, chamados de caminhamento em largura e em profundidade.

No primeiro deles (em largura), os n�s s�o acessados da esquerda para a direita, dando prioridade para os n�s de n�vel mais alto. Na Figura 1, essa ordem � denotada pelos n�meros destacados em verde. J� no segundo tipo (em profundidade), a prioridade � dada para os n�s filhos. Na Figura 1, essa ordem � denotada pelos n�meros destacados em vermelho. Essa, na verdade, � a forma mais corriqueira de se acessar n�s quando o interesse � o de gera��o de relat�rios.

V�rios tipos de consulta podem ser formulados em modelos hier�rquicos. Neste artigo, analisaremos dois tipos apenas, que chamaremos de consulta �Desce� e consulta �Sobe�. Na consulta �Desce�, o objetivo � encontrar todas as rela��es de subordina��o existentes a partir de um certo n� da �rvore. Por exemplo, supondo que queiramos saber quem s�o os subordinados do Jo�o, a resposta esperada � a parte tracejada na Figura 1. J� na consulta �Sobe�, o objetivo � descobrir os nomes de todos os chefes de algu�m (diretos e indiretos). No caso do Jo�o, a resposta seria o conjunto composto por Roger->Felipe->Jo�o (o pr�prio objeto de consulta faz parte da resposta, e os registros s�o exibidos do chefe menos direto para o mais direto).

No decorrer do artigo, mostraremos como estas duas consultas podem ser respondidas usando formas alternativas de modelagem. Vale destacar que os questionamentos que ser�o suscitados para estes casos s�o gen�ricos, e as respostas encontradas poder�o servir como guia geral para a solu��o de diversos outros tipos de consulta hier�rquica.

**Figura 1**. �rvore de relacionamentos de subordina��o

Jun��es de tabela pr�-definidas (Hardcoded Joins)

O primeiro modelo que estudaremos � o descrito na Tabela 1. O esquema, que possui dados de funcion�rios, � um dos mais comuns quando se trata de modelos hier�rquicos, e recebe o nome de modelo adjacente. O nome deve-se ao fato de que a informa��o do chefe (idChefe) � armazenada juntamente com outros dados do funcion�rio. Perceba a exist�ncia de um autorrelacionamento entre idChefe e id.

Funcion�rio
Id	Nome	idChefe
1	Roger	Null
2	Felipe	1
3	Alfredo	1
4	Joao	2
5	Ricardo	4
6	Souza	4
7	Marcos	6
8	Julio	6
9	Tiago

Tabela 1. Relacionamentos de subordina��o descritos de acordo com o modelo adjacente

Quando se trata do modelo adjacente, uma das formas de resolver consultas � fixando (hardcoding) os crit�rios de jun��o SQL. A Listagem 1 mostra como ficariam os comandos SQL necess�rios para responder �s consultas �Sobe� e �Desce�. O par�metro �:ID� corresponde ao funcion�rio a partir de onde deve ser montada a resposta, que chamaremos de funcion�rio base. O mesmo par�metro aparecer� nos demais exemplos descritos neste artigo para referenciar o funcion�rio base.


  Consulta 1 � Subordinados (Consulta Desce)
       SELECT base.id, base.nome, sub.id, sub.nome
       FROM funcionario base LEFT JOIN funcionario sub
       ON sub.idChefe = base.id
       WHERE b.idChefe = :ID
       ORDER BY base.id, sub.id
   
  Consulta 1 � Chefes (Consulta Sobe)
       SELECT chefe1.id, chefe1.nome, chefe2.id, chefe2.nome
       FROM funcionario base, funcionario chefe1, funcionario      
       chefe2
       WHERE base.id = :ID AND base.idChefe = chefe1.id 
  AND chefe1.idChefe = chefe2.id
       ORDER BY chefe1.id, chefe2.id

Listagem 1. Resolvendo as consultas �Sobe� e �Desce� usando jun��es pr�-definidas

O problema com esta abordagem se torna evidente ao analisarmos a cl�usula WHERE. As jun��es usadas conseguem atingir at� dois n�veis hier�rquicos: no caso da consulta �Desce�, dois n�veis abaixo, e na consulta �Sobe�, dois n�veis acima. No entanto, como costuma ocorrer com casos reais, n�o existem limites para os n�veis de largura e profundidade da �rvore. Assim sendo, se novos n�veis fossem acrescidos, essas rela��es extras de subordina��o n�o seriam capturadas pelas consultas. Isso implicaria em manuten��o de c�digo para que as consultas fossem adaptadas.

Supondo que o n�mero de n�veis seja constante, ainda assim o m�todo descrito merece algumas ressalvas. Em primeiro lugar destacamos o n�mero de jun��es necess�rias, equivalente ao n�mero de n�veis existentes entre o funcion�rio base e a raiz (para a consulta �Sobe�) ou entre o funcion�rio base e o �ltimo n�vel (para a consulta �Desce�). Dependendo da altura da �rvore, o tempo necess�rio para o processamento dessas jun��es pode se tornar proibitivo.

Outro fator que deve ser considerado � a redund�ncia de dados, como demonstrado na Tabela 2. A tabela exibe o resultado de uma consulta �Desce� adaptada que traz todos subordinados de Roger. As c�lulas pintadas representam informa��es que j� foram capturadas em algum registro anterior. Como se pode ver, a redund�ncia nesse caso chega a quase 50% dos resultados.

Nivel 1	Nivel 2	Nivel 3	Nivel 4	Nivel 5
Roger	Felipe	Joao	Ricardo	Null
Roger	Felipe	Joao	Souza	Marcos
Roger	Felipe	Joao	Souza	J�lio
Roger	Felipe	Joao	Souza	Thiago
Roger	Alfredo	null	Null	Null

Tabela 2. Resultado de uma consulta �Desce� adaptada que traz todos os subordinados de Roger

Fun��es recursivas em linguagens de programa��o

Uma forma de evitar a pr�fixa��o dos crit�rios de jun��o � atrav�s do uso de fun��es recursivas, explorando as facilidades existentes nas linguagens de programa��o. A Listagem 2 mostra um pseudoc�digo que atende �s consultas �Sobe� e �Desce�.


  Consulta 1 � Subordinados (Consulta Desce)
  FUN��O ExibeSubordinados(id, edenta��o) 
       //camada de BD
       SELECT id, nome
       FROM funcionario WHERE idChefe = :id
     
       //camada de software
       FA�A ENQUANTO houver registros de funcionario
           Realiza a endenta��o
           imprime funcionario.nome
           //chamada recursiva
           ExibeSubordinados(funcionario.id, edenta��o+1)
  FIM DA FUN��O
  //para imprimir os subordinados de Jo�o (id = 4)
  ExibeSubordinados(4,1);
   
  Consulta 1 � Chefes (Consulta Sobe)
  FUN��O EncontraChefes(id) //Consulta Sobe
       //camada de BD
       SELECT chefe.id, chefe.nome
       FROM funcionario base, funcionario chefe
       WHERE base.id = :ID AND base.idChefe = chefe.id 
     
       //camada de software
       SE for encontrado algum registro
           imprime chefe.nome
            //chamada recursiva
           EncontraChefes(chefe.id)
  FIM DA FUN��O
  //Encontrar chefes do Jo�o (id = 4)
  EncontraChefes(4);

Listagem 2. Resolvendo as consultas �Sobe� e �Desce� usando fun��es recursivas de linguagens de programa��o

Quanto � consulta �Desce�, o c�digo recursivo vai sucessivamente obtendo/imprimindo os subordinados de cada funcion�rio, empregando o caminhamento em profundidade. A fun��o � gen�rica e permite que a impress�o comece em qualquer n�vel da �rvore atrav�s do fornecimento do identificador correto. Se o valor fornecido for nulo, a �rvore inteira � impressa. O c�digo tamb�m descreve em linhas gerais como o controle de endenta��o pode ser feito para garantir que a disposi��o hier�rquica dos funcion�rios no relat�rio possa ser visualmente compreendida.

O c�digo referente � consulta �Sobe� segue a mesma linha do anterior. Em uma itera��o do algoritmo, � descoberto quem � o chefe do funcion�rio passado como par�metro. Al�m de serem impressos, os dados do chefe s�o repassados para a fun��o para que a itera��o seguinte descubra quem est� no n�vel superior, e assim sucessivamente at� atingir o n�vel m�ximo.

Conta a favor desta abordagem a sua simplicidade. O c�digo demonstrado � bastante intuitivo e poderia ser facilmente aplicado para resolver os problemas propostos neste artigo. No entanto, se trata de uma sa�da custosa, pois cada n� visitado gera uma consulta extra. Por exemplo, considerando a �rvore da Figura 1, e supondo que se deseje imprimir a �rvore inteira, nove consultas teriam que ser submetidas ao banco. Parece um n�mero razo�vel, mas n�o se esque�a que estamos trabalhando com uma �rvore bastante pequena. Em uma corpora��o com muitos funcion�rios, o �nus de comunica��o com o banco tornaria esta solu��o extremamente invi�vel.

Carga total para a mem�ria

Ainda considerando linguagens de programa��o, pode-se reduzir os custos de comunica��o com o banco de dados atrav�s de um processo inicial de carga total para a mem�ria. Nesse processo, todos os registros de funcion�rios s�o carregados para a mem�ria onde ficam residentes em uma estrutura de �rvore.

A consulta SQL de carga � simples, como mostra a Listagem 3. O trabalho maior fica a cargo da linguagem de programa��o, que dever� criar os objetos relativos aos funcion�rios e associ�-los aos seus chefes. Com todos os dados em mem�ria, consultas s�o respondidas atrav�s do caminhamento da �rvore.


  //Obt�m todos os dados
       SELECT f.id, f.nome, f.idChefe
       FROM funcionario f

Listagem 3. Consulta que obt�m todos os dados da tabela adjacente de subordina��o

Como benef�cio desta abordagem, t�m-se todos os recursos da linguagem de programa��o � disposi��o para a realiza��o das consultas, o que assegura um poder de express�o muito maior do que o de uma linguagem declarativa como a SQL. Outra vantagem em rela��o ao m�todo anterior est� no n�mero reduzido de acessos ao banco (necess�rios apenas no momento de carga inicial).

Caso n�o seja poss�vel manter os dados em sess�o, a sa�da � recriar a �rvore a cada requisi��o ao servidor. Aqui � importante ter cuidado. Caso a tabela possua muitos registros, a consulta pode ser muito custosa. Na verdade, se o n�mero de registros for muito elevado, at� mesmo manter a �rvore em mem�ria � perigoso. Se este for o caso, talvez seja melhor escolher outra alternativa.

Stored Procedures

Nas duas se��es anteriores, vimos como os problemas propostos s�o resolvidos quando se delega a complexidade para a camada de software. Nesta se��o, o enfoque � oposto. Boa parte do processamento � realizada dentro de uma stored procedure (SP), deixando para a camada de software o simples trabalho de impress�o dos resultados obtidos.

A Listagem 4 mostra stored procedures em MySQL usadas para encontrar as respostas. Como se pode ver, as SPs s�o bastante parecidas. Os dois algoritmos utilizam uma tabela auxiliar, usada para armazenar resultados parciais. Basicamente, no decorrer do processamento s�o realizadas buscas em largura, jogando para a tabela auxiliar os registros que forem sendo encontrados.

Para a consulta �Desce�, a cada itera��o s�o buscados os registros cujos chefes j� estiverem na tabela de resposta. Para a consulta �Sobe�, a cada itera��o s�o buscados os registros cujos subordinados j� estiverem na tabela de resposta. A clausula IGNORE � pr�pria do MySQL e garante que n�o ocorrer� erro ao se tentar inserir registros que j� existirem na tabela.


  Consulta 1 � Subordinados (Consulta Desce)
          DROP PROCEDURE IF EXISTS calculaArvore;
          DELIMITER go
          CREATE PROCEDURE calculaArvore(raiz INT )
          BEGIN
          DROP TABLE IF EXISTS arvore;
          CREATE TABLE arvore
          SELECT id, idChefe, 0 AS nivel
          FROM funcionario
          WHERE idChefe = raiz;
          ALTER TABLE arvore ADD PRIMARY KEY(id);
          REPEAT
          INSERT IGNORE INTO arvore
          SELECT f.id, f.idChefe, arv.nivel+1
          FROM funcionario f
          JOIN arvore arv ON f.idChefe = arv.id;
          UNTIL Row_Count() = 0 END REPEAT;
          END;
          go
 
 Consulta 2 � Chefes (Consulta Sobe)
          DROP PROCEDURE IF EXISTS calculaArvore;
          DELIMITER go
          CREATE PROCEDURE calculaArvore(raiz INT )
          BEGIN
          DROP TABLE IF EXISTS arvore;
          CREATE TABLE arvore
          SELECT id, idChefe, 0 AS nivel
          FROM funcionario
          WHERE id = raiz;
          ALTER TABLE arvore ADD PRIMARY KEY(id);
          REPEAT
          INSERT IGNORE INTO arvore
          SELECT f.id, f.idChefe, arv.nivel+1
          FROM funcionario f
          JOIN arvore arv ON arv.idChefe = f.id;
          UNTIL Row_Count() = 0 END REPEAT;
          END;
          go

Listagem 4. Resolvendo as consultas �Sobe� e �Desce� usando Store Procedures

A computa��o come�a a ficar mais densa � medida que a tabela auxiliar aumenta, pois a cada itera��o os dados dessa tabela s�o cruzados com os dados da tabela �Funcionario�. Outro efeito desagrad�vel � o desperd�cio de processamento na gera��o de registros redundantes, pois o conjunto de dados usado em uma intera��o para encontrar resultados � um subconjunto dos dados usados na intera��o seguinte. Ou seja, mesmo reduzindo os custos de comunica��o com o SGBD, os custos internos de processamento podem se tornar expressivos. Dependendo da pol�tica de seguran�a configurada pelo DBA, � bem poss�vel que consultas demoradas sejam interrompidas por timeout.

Se for esse o caso, n�o se preocupe, existem diversos tipos de SP que podem ser usadas. A que foi mostrada acima usa particularidades do MySQL, e consegue fugir do processamento recursivo, t�o temido por alguns. Outros tipos de SP s�o mais gen�ricos (n�o ficam restritos a algum SGBD espec�fico) e usam estrat�gias diferentes para buscar os dados de interesse. Por exemplo, uma abordagem gen�rica bastante comum emprega tabelas auxiliares que tem por objetivo empilhar informa��es. Em um momento posterior, estas informa��es s�o desempilhadas e tratadas j� na ordem correta de caminhamento.

Observe que, para a consulta �Desce�, os registros s�o disponibilizados na ordem de caminhamento em largura. � necess�rio levar isso em considera��o na hora de elaborar o algoritmo que consumir� esses dados, principalmente se o objetivo for a gera��o de relat�rios de subordina��o. No caminhamento em largura, muitos dos n�s lidos s� ser�o impressos mais adiante. Assim, � preciso mant�-los em mem�ria at� o momento em que eles forem processados. Antes de adotar uma solu��o baseada no caminhamento em largura, verifique se essa sobrecarga � aceit�vel. J� no caminhamento em profundidade os n�s s�o lidos na ordem em que devem ser impressos. A princ�pio isso parece evitar o uso desnecess�rio de recursos computacionais. No entanto, dependendo de como a solu��o foi desenvolvida, parte das vantagens dessa forma de caminhamento s�o perdidas. Por exemplo, caso a solu��o seja baseada em recursividade, � poss�vel que alguns recursos precisem ser alocados, seja na forma de registros em mem�ria ou conex�es extras com o banco de dados.

Recursos espec�ficos de SGBDs

A se��o anterior mostrou como problemas de consultas hier�rquicas podem ser resolvidos usando Stored Procedures. Apesar desse recurso estar presente em praticamente todos SGBDs comerciais, a sintaxe para cria��o das SPs � pr�pria de cada fornecedor. Isso dificulta processos de migra��o de bancos de dados, pois todas SPs precisariam ser convertidas para o novo formato. Caso voc� esteja muito satisfeito com seu banco, e n�o se preocupa com o uso de recursos espec�ficos, siga lendo esta se��o.

O que apresentaremos se chama Common table Expressions (CTE). Esse recurso permite gerar resultados intermedi�rios, que s�o complementados atrav�s de chamadas recursivas que usam os mesmos resultados intermedi�rios. A capacidade de chamar a si pr�prio possibilita que estruturas hier�rquicas sejam processadas de forma simples.

A Listagem 5 mostra como responder as consultas �Sobe� e �Desce� utilizando CTE. O c�digo usa a sintaxe pr�pria do PostGres, mas com poucas adapta��es ele pode ser traduzido para sintaxes de outros bancos, como DB2 e SQL Server.


  Consulta 1 � Subordinados (Consulta Desce)
  WITH RECURSIVE chefe AS
  (
      SELECT id, nome, idChefe, 0 AS nivel 
      FROM funcionario WHERE id= :ID 
      
      UNION ALL
      
      -- chamada recursiva
      SELECT sub.id, sub.nome, sub.idChefe, nivel+1
      FROM funcionario sub
      JOIN chefe ON (sub.idChefe = chefe.id)
  )
  SELECT * FROM chefe ORDER BY nivel;
   
   
  Consulta 2 � Chefes (Consulta Sobe)
  WITH RECURSIVE sub AS
  (
      SELECT id, name, idChefe, 0 AS nivel 
      FROM funcionario WHERE id= :ID 
      
      UNION ALL
      
      -- chamada recursiva
      SELECT chefe.id, chefe.name, chefe.idChefe, nivel+1
      FROM funcionario chefe
      JOIN sub ON (sub.idChefe = chefe.id)
  )
  SELECT * FROM sub ORDER BY nivel DESC;

Listagem 5. Resolvendo as consultas �Sobe� e �Desce� usando CTE

Para a consulta �Desce�, o resultado intermedi�rio pode ser gerado inicialmente com um registro base, correspondente ao chefe de interesse. Uma chamada recursiva seria usada para encontrar os subordinados desse chefe. Para esses subordinados, uma nova chamada recursiva seria usada para encontrar seus respectivos subordinados, e assim por diante. No final, todos os registros encontrados s�o unidos. O efeito � parecido a SP demonstrada na se��o anterior, com os registros finais gerados na ordem de caminhamento em largura. No entanto, o mecanismo empregado para a gera��o da resposta � mais eficiente, n�o calculando registros redundantes e usando conjuntos de dados mais enxutos durante a computa��o. J� a consulta �Sobe� se assemelha tanto com a consulta �Desce� que dispensa muita explica��o. A �nica diferen�a � que a recurs�o � usada para buscar os chefes, e com isso o crit�rio de jun��o (chefe=idChefe) precisa ser invertido. Vale ressaltar que esse artif�cio n�o est� presente em todos SGBDs. Por exemplo, o MySQL n�o possui suporte a esse tipo de chamada recursiva. Para tratar dados hier�rquicos no MySQL, ou usa-se algum m�todo baseado em SQL ANSI ou usa-se stored procedures como as descritas na se��o anterior. J� outros SGBDs n�o apenas suportam CTE, mas oferecem outras possibilidades para fins parecidos. Por exemplo, o CONNECT BY da Oracle resolve consultas hier�rquicas de uma maneira relativamente simples.

Outro ponto que merece destaque � um que j� foi mencionado antes. O grande inconveniente das solu��es comentadas nessa se��o, seja CTE, SPs ou CONNECT BY, � o fato de que elas usam linguagens propriet�rias. Se porventura surgir a necessidade de migrar para outro fornecedor de banco de dados, todo c�digo propriet�rio precisar� ser convertido. Em alguns casos a convers�o pode ser intuitiva, mas de qualquer forma, ser� algo a mais com o que se preocupar.

Modelo Plano

A Tabela 3 mostra como ficam os dados de exemplo depois da adi��o destes atributos. Opcionalmente, a tabela poderia ser dividida verticalmente em duas, deixando a tabela original com informa��es pr�prias do funcion�rio (ex. �Id�, �nome�) e a tabela derivada com informa��es de controle de hierarquia (�rank�, �n�vel�, �idChefe�). A divis�o torna o modelo mais modular, uma vez que ele ajuda a definir o papel de cada tabela do modelo. Por outro lado, as consultas hier�rquicas passam a conter jun��es extras para associar os registros divididos. Para fins did�ticos, neste artigo optamos pela solu��o mais simples, e mantivemos tudo em uma �nica tabela. Em aplica��es reais, caber� ao projetista escolher a op��o que julgar mais conveniente.

Funcion�rio
id	Nome	idChefe	rank	N�vel
1	Roger	Null	1	1
2	Felipe	1	2	2
3	Alfredo	1	9	2
4	Joao	2	3	3
5	Ricardo	4	4	4
6	Souza	4	5	4
7	Marcos	6	6	5
8	Julio	6	7	5
9	Tiago	6	8	5

Tabela 3. Relacionamentos de subordina��o descritos de acordo com o modelo adjacente plano

Com base nas informa��es da Tabela 3, pode-se usar o SQL da Listagem 6 para imprimir toda a �rvore de funcion�rios.


  //Obt�m todos os dados
  SELECT nome, nivel
       FROM funcionario 
       ORDER BY rank

Listagem 6. Consulta que obt�m todos os dados da tabela adjacente plana de subordina��o

Observe o uso do atributo rank. Ao ordenar a consulta por esse atributo, se garante que os registros sejam lidos na ordem com que devem ser inseridos na �rvore (leitura em profundidade). No entanto, sua utilidade se restringe a poucos casos. Por exemplo, o atributo � �til se for necess�rio imprimir um relat�rio com todos os n�veis de profundidade (o que � um subcaso da consulta �Desce�). Na maioria dos outros casos, seria necess�rio usar algumas das solu��es mostradas anteriormente.

J� o atributo n�vel ajuda no controle da endenta��o. Com base no valor desse atributo sabe-se qual a tabula��o que deve ser empregada na impress�o. Esse atributo representa uma forma de evitar que a endenta��o tenha que ser calculada via linguagem de programa��o, como foi demonstrado nas primeiras se��es do artigo. O problema passa a ser atualizar os valores do atributo quando os dados de hierarquia sofrerem modifica��es.

Nested Set Model

Na se��o anterior foi mostrado um modelo onde um atributo (rank) armazena a posi��o do elemento dentro da �rvore, com base no caminhamento por profundidade. Nesta se��o, veremos um modelo que segue esta mesma linha, mas que pode ser empregado em um n�mero maior de problemas.

Em vez de um atributo, teremos dois atributos cujo prop�sito � armazenar o posicionamento do elemento. Vamos cham�-los de dir (direita) e esq (esquerda).

A Figura 2 mostra a �rvore j� preenchida com esta nova informa��o posicional. O preenchimento ocorre da seguinte forma: um valor � incrementado conforme se caminha pela �rvore em profundidade. Quando se passa por um elemento na descida, o valor da esquerda � atualizado com o pr�ximo incremento. Quando se passa por um elemento na subida, o valor da direita � atualizado.

rvore de relacionamentos de subordina��o com
propriedades do Nested Set Model — **Figura 2**. �rvore de relacionamentos de subordina��o com propriedades do Nested Set Model

A Tabela 4 mostra como ficaria o novo esquema de acordo com este modelo. Observe que o atributo �idChefe� foi removido, uma vez que � poss�vel obter esta informa��o atrav�s dos atributos �esq� e �dir�.

Voc� deve estar se perguntando como calcular os valores no momento de altera��es nesta tabela. Neste artigo n�o mostraremos como isso � feito, mas fique tranquilo. Existem scripts que atualizam corretamente estes atributos, quando um funcion�rio for inclu�do, removido ou remanejado.

Funcionario
Id	Nome	Esq	Dir	Nivel
1	Roger	1	18	1
2	Felipe	2	15	2
3	Alfredo	16	17	2
4	Joao	3	14	3
5	Ricardo	4	5	4
6	Souza	6	13	4
7	Marcos	7	8	5
8	Julio	9	10	5
9	Tiago	11	12	5

Tabela 4. Relacionamentos de subordina��o descritos de acordo com o Nested Set Model

Observando a �rvore da Figura 2, podemos perceber uma caracter�stica importante. Se compararmos algum n� filho com qualquer um de seus n�s pai, veremos que o atributo �esq� do n� filho � sempre maior do que o atributo �esq� do pai, e menor do que o atributo �dir� do pai. Essa propriedade � garantida pela forma como os atributos s�o calculados, e se mostra particularmente �til para responder consultas nesse modelo.

Um exemplo de sua serventia fica evidente na Listagem 7. Para encontrar os subordinados de algum chefe, primeiro criamos duas inst�ncias da tabela �Funcionario�, uma para representar o chefe e outra para buscar seus subordinados. O pr�ximo passo � comparar os atributos �esq� e �dir� do chefe escolhido com o atributo �esq� de cada um dos funcion�rios existentes. J� para buscar os chefes de algum funcion�rio, basta fazer a correla��o contr�ria, definindo o subordinado escolhido e comparando os atributos �esq� e �dir� usando a l�gica inversa.

Como j� demonstrado em outro exemplo, o atributo �nivel� � usado para controlar a altura na �rvore. Esse atributo � �til para a endenta��o dos resultados na consulta �Desce�, pois ajuda a determinar quem � o chefe direto dos funcion�rios retornados. Na verdade, essa informa��o � desnecess�ria. Existe uma correla��o entre os atributos �esq� e �dir� que responde essa pergunta. Deixaremos para voc� a miss�o de analisar os dados e resolver esse dilema.


  Consulta 1 � Subordinados (Consulta Desce)
 SELECT sub.id, sub.nome, sub.nivel 
 FROM funcionario base, funcionario sub 
 WHERE sub.esq <= base.dir  AND sub.esq >= base.esq 
  AND base.id = :ID 
 ORDER BY sub.esq
  
 Consulta 2 � Chefes (Consulta Sobe)
  SELECT chefe.id, chefe.nome 
 FROM funcionario chefe, funcionario base 
 WHERE base.esq <= chefe.dir AND base.esq >= chefe.esq  
  AND base.id = :ID 
 ORDER BY chefe.esq

Listagem 7. Resolvendo as consultas �Sobe� e �Desce� usando Nested Set Model

As consultas da Listagem 7 obt�m um �timo desempenho se comparadas com as abordagens anteriores. Com apenas uma jun��o � poss�vel descobrir todos subordinados ou todos os chefes de algu�m. No entanto, nem todas as tarefas possuem a mesma simplicidade. Na verdade, tarefas que deveriam ser simples exigem a ado��o de scripts complexos. Por exemplo, a exclus�o de algum funcion�rio pode requerer que boa parte dos demais funcion�rios tenham seus atributos �esq� e �dir� atualizados. Uma forma de minimizar esse problema envolve o uso de valores mais �espalhados� para os atributos �esq� e �dir�. A escolha correta de valores para esses atributos pode evitar que altera��es em algum n� da �rvore tenham que ser propagados para n�s vizinhos.

As opera��es de consulta tamb�m podem exigir uma boa dose de processamento em alguns casos espec�ficos. Por exemplo, para descobrir o subordinado (ou o chefe) imediato de algum funcion�rio, s�o necess�rios tr�s autorrelacionamentos e uma subconsulta, sendo que o modelo adjacente puro resolve o problema com apenas um autorrelacionamento.

Para casos como esse, n�o existe f�rmula m�gica que torne a consulta mais enxuta. Caso voc� decida que o Nested Set Model � ideal para as suas necessidades, o que pode ser feito � identificar subconsultas que s�o disparadas com muita frequ�ncia e transform�-las em vis�es. Isso n�o elimina a necessidade de subconsultas, mas agiliza seu processamento. No final das contas, seja qual for o modelo que voc� escolher, um bom tuning sempre ter� o seu valor.

Modelos de Enumera��o de Caminho

Nesta se��o mostraremos solu��es baseadas em modelos de enumera��o de caminho. Esses modelos se caracterizam pelo uso de um atributo especial, cuja fun��o � armazenar o caminho hier�rquico dos elementos. Dois submodelos se destacam: Enumera��o de V�rtice (Node Enumeration) e Enumera��o de Arco (Edge Enumeration), sendo que a denomina��o depende do conte�do que � armazenado no atributo.

A Tabela 5 mostra um exemplo de Enumera��o de V�rtice. O caminho at� um funcion�rio est� indicado no atributo �caminho�. Esse atributo armazena o identificador do pr�prio funcion�rio concatenado com os identificadores de seus chefes. Usamos a barra (/) para separar os identificadores. Contudo, qualquer caractere pode ser usado, desde que se possa garantir que ele n�o ir� aparecer como parte de algum identificador. Assim como no modelo plano, o atributo n�vel � usado unicamente para controle de endenta��o. Quem achar melhor remov�-lo, poder� fazer a endenta��o via linguagem de programa��o, inferindo o n�vel pelo n�mero de barras (/) presentes no atributo �caminho�.

Funcionario
Id	Nome	idChefe	Caminho	N�vel
1	Roger	Null	1	1
2	Felipe	1	1/2	2
3	Alfredo	1	1/3	2
4	Joao	2	1/2/4	3
5	Ricardo	4	1/2/4/5	4
6	Souza	4	1/2/4/6	4
7	Marcos	6	1/2/4/6/7	5
8	Julio	6	1/2/4/6/8	5
9	Tiago	6	1/2/4/6/9	5

Tabela 5. Relacionamentos de subordina��o descritos de acordo com o Modelo de Enumera��o de V�rtice

A Listagem 8 mostra as consultas que resolvem os problemas �Sobe� e �Desce�. Para encontrar os subordinados, a ideia � procurar por registros cujo caminho contenha o caminho do registro base, o que no MySQL pode ser obtido atrav�s do operador POSITION. O operador POSITION tamb�m � utilizado para encontrar os chefes, por�m de forma oposta. Desta vez a ideia � procurar por registros cuja sequ�ncia esteja contida na sequ�ncia do registro base. � importante ressaltar que as duas consultas demonstradas recorrem a fun��es de string para chegar at� um resultado. Por esse motivo, para agilizar a busca, � interessante que seja criado algum �ndice sobre o atributo �caminho�.


  Consulta 1 � Subordinados (Consulta Desce)
 SELECT sub.nome, sub.id, sub.nivel 
 FROM funcionario base, funcionario sub 
 WHERE POSITION(base.caminho IN sub.caminho)
  AND base.id = :ID 
  ORDER BY sub.caminho;
   
  Consulta 2 � Chefes (Consulta Sobe)
  SELECT chefe.nome, chefe.id 
 FROM funcionario base, funcionario chefe 
 WHERE POSITION(chefe.caminho IN base.caminho) 
  AND base.id = :ID 
 ORDER BY chefe.caminho;

Listagem 8. Resolvendo as consultas �Sobe� e �Desce� usando o Modelo de Enumera��o de V�rtice

Na enumera��o de arco, o atributo �caminho� recebe um conte�do diferente. Em vez do identificador do pr�prio registro, usa-se um n�mero de sequ�ncia pr�prio que identifica a posi��o de um elemento embaixo do seu pai. A Tabela 6 mostra como ficariam os dados se o caminho fosse gerado dessa forma.

Funcionario
id	nome	idChefe	Caminho	n�vel
1	Roger	Null	1	1
2	Felipe	1	1/1	2
3	Alfredo	1	1/2	2
4	Joao	2	1/1/1	3
5	Ricardo	4	1/1/1/1	4
6	Souza	4	1/1/1/2	4
7	Marcos	6	1/1/1/2/1	5
8	Julio	6	1/1/1/2/2	5
9	Tiago	6	1/1/1/2/3	5

Tabela 6. Relacionamentos de subordina��o descritos de acordo com o Modelo de Enumera��o de Arco

Os mesmos algoritmos usados na Enumera��o de V�rtice podem ser usados na Enumera��o de Arco, sendo que os resultados s�o bastante parecidos. A diferen�a pode ocorrer na ordem com que os elementos irm�os s�o exibidos. A ordem � definida pelo atributo caminho. Na Enumera��o de V�rtice, este atributo possui identificadores dos registros, o que torna dif�cil controlar a sequ�ncia em que os registros irm�os s�o retornados.

J� com a Enumera��o de Arco, o caminho � composto por um n�mero sequencial, cujo valor � determinado pela l�gica de inser��o que o projetista elaborou. Assim, caso se deseje preservar uma determinada ordem entre irm�os, a Enumera��o de Arco � mais adequada. Apenas esteja ciente de que ser� necess�rio um trabalho extra para que os n�meros sequenciais sejam gerados de acordo.

Tamb�m � importante observar que existe um limite para o n�mero de n�veis que esses modelos suportam, e esse limite est� relacionado com o tamanho do atributo �Caminho�. Por exemplo, suponha que esse atributo seja um char de 255 posi��es, e que os identificadores possam ter no m�ximo cinco d�gitos cada (m�ximo 99999). Nessas circunst�ncias, s�o suportados at� 51 n�veis, sem que o tamanho do atributo estoure. Dependendo dos requisitos do projeto, tal quantidade de n�veis pode variar entre adequada, razo�vel e at� mesmo arriscada. Antes de tomar uma decis�o, verifique quais s�o as reais necessidades, tanto imediatas quanto de longo prazo. Afinal, ainda que se possa adaptar o modelo para suprir n�veis excedentes (por exemplo, atrav�s da adi��o de um novo atributo de caminho), este trabalho acaba gerando um estresse que poderia ser evitado.

M�todo Chandler

De certa forma, a abordagem apresentada nesta se��o tamb�m se baseia na informa��o de caminho. A diferen�a fundamental � que, em vez de um �nico atributo, m�ltiplos atributos s�o necess�rios, um para cada n�vel da �rvore.

A Tabela 7 mostra os atributos necess�rios para a nossa �rvore de exemplo, juntamente com os valores que foram atribu�dos para eles. Se compararmos estas informa��es com o caminho armazenado na Tabela 6, veremos que a l�gica deste modelo se aproxima bastante da l�gica empregada na Enumera��o de Arco.

O n�mero de n�veis preenchidos (diferentes de zero) mostra a altura do funcion�rio dentro da hierarquia. Por exemplo, o Diretor Executivo (grau m�ximo na institui��o) est� no topo, pois apenas um n�vel est� preenchido. Os subordinados recebem os mesmos valores atribu�dos para seus respectivos chefes, com exce��o do atributo que indica o seu pr�prio n�vel. Este recebe um n�mero sequencial, que indica a ordem do subordinado embaixo do seu chefe.

Funcionario
id	Nome	nivel1	nivel2	nivel3	nivel4	nivel5	n�vel
1	Roger	1	0	0	0	0	1
2	Felipe	1	1	0	0	0	2
3	Alfredo	1	2	0	0	0	2
4	Joao	1	1	1	0	0	3
5	Ricardo	1	1	1	1	0	4
6	Souza	1	1	1	2	0	4
7	Marcos	1	1	1	2	1	5
8	Julio	1	1	1	2	2	5
9	Tiago	1	1	1	2	3	5

Tabela 7. Relacionamentos de subordina��o descritos de acordo com o Modelo de Chandler

A Listagem 9 mostra os comandos usados para responder as duas consultas propostas. Para popular espa�o, usamos apelidos curtos para os funcion�rios base (b), chefe (c) e subordinado (s).

O comando SQL usado para encontrar os subordinados � bastante simples. A rela��o entre o funcion�rio base e seus subordinados � alcan�ada atrav�s de uma compara��o dos seus n�veis. � importante observar que a compara��o precisa ser feita pelo atributo correto, que � aquele que indica a altura do funcion�rio base. No caso da Jo�o, trata-se do atributo �nivel3�.

Para que a impress�o do relat�rio respeite o caminhamento em profundidade, � preciso ordenar os registros pelos n�veis, conforme indicado no comando SQL. Os n�veis tamb�m podem ser usados para controle de endenta��o. Quanto mais n�veis diferentes de zero, maior ser� a tabula��o dada na impress�o.

Para encontrar os chefes de um funcion�rio, aplica-se a l�gica inversa da usada para encontrar os subordinados, como em outros casos mostrados no artigo. Para orientar a compara��o de n�veis, verifica-se o atributo �nivel� do funcion�rio �chefe� em vez do atributo �nivel� do funcion�rio �base�.

Como se pode ver, o atributo �nivel� tem um papel important�ssimo. Com ele, � poss�vel criar consultas gen�ricas compostas por crit�rios condicionais (CASE-WHEN). Sem ele, os crit�rios de compara��o teriam que ser ajustados dependendo da altura do funcion�rio que se deseja pesquisar, o que tornaria a consulta engessada. A solu��o que apresentamos aqui � na verdade uma adapta��o do modelo Chandler, visto que o modelo original n�o faz men��o ao uso desse atributo.


  Consulta 1 � Subordinados (Consulta Desce)
 SELECT s.id, s.nome, s.nivel
  FROM  funcionario b, funcionario s 
  WHERE b.id = :ID AND 
  CASE 
  WHEN b.nivel= 1 THEN b.nivel1 = s.nivel1 
  WHEN b.nivel= 2 THEN b.nivel2 = s.nivel2 
  WHEN b.nivel= 3 THEN b.nivel3 = s.nivel3 
  WHEN b.nivel= 4 THEN b.nivel4 = s.nivel4 
  WHEN b.nivel= 5 THEN b.nivel5 = s.nivel5 
  END  
  ORDER BY c.nivel1, c.nivel2, c.nivel3, c.nivel4, c.nivel5; 
   
  Consulta 2 � Chefes (Consulta Sobe)
 SELECT c.id, c.nome, c.nivel 
 FROM  funcionario b, funcionario c 
 WHERE b.id = :ID AND 
  CASE 
 WHEN c.nivel = 1 THEN b.nivel1 = c.nivel1 
 WHEN c.nivel = 2 THEN b.nivel2 = c.nivel2
 WHEN c.nivel = 3 THEN b.nivel3 = c.nivel3
 WHEN c.nivel = 4 THEN b.nivel4 = c.nivel4
 WHEN c.nivel = 5 THEN b.nivel5 = c.nivel5 
  END
 ORDER BY c.nivel1, c.nivel2, c.nivel3, c.nivel4, c.nivel5;

Listagem 9. Resolvendo as consultas �Sobe� e �Desce� usando o Modelo de Chandler

J� vimos que o M�todo Chandler se aproxima bastante do modelo de Enumera��o de Arco, ao menos conceitualmente. Isso nos leva � conclus�o l�gica de que esse m�todo pode tamb�m ser aplicado nos moldes da Enumera��o por V�rtice. A Tabela 8 mostra o Modelo de Chandler adaptado (mais uma vez), usando identificadores dos registros como os valores dos n�veis, em vez de n�meros sequenciais.

Funcionario
id	Nome	nivel1	nivel2	nivel3	nivel4	nivel5	nivel
1	Roger	1	0	0	0	0	1
2	Felipe	1	2	0	0	0	2
3	Alfredo	1	3	0	0	0	2
4	Joao	1	2	4	0	0	3
5	Ricardo	1	2	4	5	0	4
6	Souza	1	2	4	6	0	4
7	Marcos	1	2	4	6	7	5
8	Julio	1	2	4	6	8	5
9	Tiago	1	2	4	6	9	5

Tabela 8. Relacionamentos de subordina��o descritos de acordo com uma mescla do Modelo de Chandler e o modelo de Enumera��o de V�rtice

Para imprimir uma sub�rvore, ou listar os chefes, o processo � exatamente igual ao usado na Listagem 9. Nenhuma linha precisaria ser modificada. O benef�cio desse novo padr�o de representa��o de n�veis se torna aparente em outros tipos de consulta. Por exemplo, o chefe direto de algu�m pode ser descoberto com uma consulta simples. Outro exemplo bacana envolve descobrir o chefe que est� a uma certa altura de algu�m, sendo a altura definida por um crit�rio de sele��o. A resolu��o desse problema fica como exerc�cio para voc�.

Para quem estiver se perguntando, o nome deste m�todo � dedicado a pessoa que garantiu os direitos de propriedade intelectual da ideia. Chega a surpreender o fato de algu�m ter conseguido patentear o modelo, pois se trata de uma solu��o que sempre foi de conhecimento p�blico (ou pelo menos aparentava ser). De qualquer forma, o M�todo Chandler foi concebido como uma forma de evitar as opera��es com strings necess�rias com os modelos de Enumera��o de Caminho. No entanto, ele usualmente requer o uso de consultas pouco intuitivas, como acabamos de ver nos exemplos. Al�m disso, trata-se de uma solu��o um tanto amarrada. Afinal, al�m da dificuldade em montar consultas gen�ricas (que conseguimos vencer com o uso de um atributo extra), � preciso saber de antem�o quantos n�veis devem ser suportados. Se a �rvore crescer al�m do esperado, novos atributos precisariam ser adicionados, e estas mudan�as de esquema quase nunca s�o vistas com bons olhos.

Dados hier�rquicos e os paradigmas de programa��o

De certo modo, linguagens de programa��o s�o mais prop�cias para realizar determinadas opera��es, especialmente sobre modelos hier�rquicos. Isso ocorre porque as linguagens normalmente usadas s�o procedurais. Isto �, cabe ao desenvolvedor especificar exatamente o que deve ser feito, usando pequenos blocos de constru��o. Isso lhe d� uma flexibilidade tremenda, e abre a possibilidade para que algoritmos dos mais complexos possam ser implementados.

Com SQL � diferente. Trata-se de uma linguagem declarativa, onde o desenvolvedor especifica o que deve ser feito, e n�o como. Linguagens declarativas s�o naturalmente mais limitadas, servindo para um tipo espec�fico de opera��o. No caso do SQL, as opera��es ocorrem sobre rela��es. Esse � o seu forte. � por isso que, ao modelar hierarquias como rela��es � esperado encontrar dificuldades em especificar alguns tipos de consulta.

Uma possibilidade ainda n�o mencionada envolve utilizar linguagens de consulta voltadas a dados hier�rquicos, como XPath/XQuery. Xquery � uma linguagem declarativa, assim como SQL. A diferen�a � que ela foi projetada para modelos hier�rquicos, sendo baseada em caminhos de acesso e uma s�rie de recursos com os quais j� estamos acostumados, como caracteres coringa e filtros. Ou seja, para consultas hier�rquicas, essa linguagem se torna naturalmente mais expressiva do que a linguagem SQL.

Deixamos a Listagem 10 como exemplo de consulta que pode ser criada por meio desse paradigma. A consulta l� um documento XML contendo dados de funcion�rios e retorna um documento XML contendo a �rvore de subordina��o desses funcion�rios.


  Consulta 1 � Subordinados (Desce)
 declare function acme:exibeSub($func) { 
  <Func nome="{$func/nome}"> 
  <Subordinados> 
  {
  for $f in //Funcionario[idChefe = $func/id] 
  return acme:exibeSub($f) 
  } 
  </Subordinados>
   </Func> 
  };
  //exibe os subordinados do diretor executivo 
  acme:exibeSub (//Funcionario[empty(idChefe/text())])

Listagem 10. Resolvendo as consultas �Desce� usando XQuery

Como mencionado, a consulta XQuery da Listagem 10 requer um documento XML como entrada. Se estamos trabalhando com uma base relacional, isso significa que ter�amos que primeiro converter os dados para um formato compat�vel com XQuery. Por exemplo, poder�amos carregar os dados para uma �rvore DOM e processar os relacionamentos de subordina��o a partir da�. Essa solu��o lembra a que foi explicada na se��o �Carga Total para a Mem�ria�, s� que nesse caso usamos SQL para carregar os dados e XQuery para navegar por eles.

Em vez dessa solu��o h�brida, onde duas linguagens de consulta s�o necess�rias, tamb�m se poderiam utilizar bancos de dados XML nativos. Nesses bancos de dados, toda informa��o � modelada em formato XML. Naturalmente, a linguagem de consulta oficial � baseada em XPath e XQuery. No entanto, tais bancos de dados n�o s�o muito populares, e seu uso � mais voltado para certos tipos espec�ficos de aplica��o. Por exemplo, quando a finalidade mais comum dos dados � o transporte para outros sistemas, e esse transporte � realizado via XML, talvez seja mais indicado que esses dados j� estejam armazenados em XML. Quando a finalidade mais comum � o consumo direto por aplica��es, o apelo deste tipo de banco diminui bastante.

Isso vale para os bancos de dados orientados a objetos, ou objeto-relacionais. Seu uso � mais aconselhado para a manipula��o de dados complexos, como aqueles envolvidos em aplica��es de biologia molecular e manipula��o de objetos espaciais. Al�m do mais, o processamento de consultas hier�rquicas n�o � exatamente o forte desse paradigma. Por um lado, o acesso navegacional atrav�s de ponteiros simplifica e agiliza o processamento de muitos tipos de consulta. No entanto, a capacidade de navegar pelos objetos acaba n�o ajudando muito quando os dados est�o dispostos em uma hierarquia de muitos n�veis. Nesses casos, um banco de dados relacional apoiado por uma boa modelagem pode ser a melhor sa�da.

Outra possibilidade envolve abandonar de vez os bancos relacionais e partir para SGBDs hier�rquicos, como o IMS da IBM (ler Nota do DevMan 1). Pelo nome, podemos supor que bancos hier�rquicos s�o a melhor pedida para processar consultas hier�rquicas. Ser�? � importante n�o fazer julgamentos precipitados. Bancos hier�rquicos s�o conhecidos pela rapidez com que os dados s�o acessados. No entanto, seu uso � um tanto complexo, principalmente para os mais jovens, acostumados com as linguagens de programa��o de quarta gera��o.

Para exemplificar, no caso do IMS, o acesso aos dados poderia ocorrer atrav�s de uma aplica��o escrita em COBOL que realizasse chamadas ao IMS via DL/I. Isso significa criar um programa altamente estruturado onde o acesso aos dados � realizado atrav�s de �reas mapeadas chamadas de blocos de controle. Depois disso tudo, talvez ainda seja necess�rio encapsular a aplica��o COBOL em um adaptador que aceite comandos SQL, para que uma aplica��o escrita em Java consiga acessar os dados. Isso sem falar que o IMS deve ser executado em plataformas do tipo mainframe.

Ou seja, trata-se de uma solu��o complexa e acima de tudo cara, tanto para a aquisi��o dos produtos/plataformas necess�rios quanto para a cria��o e manuten��o das aplica��es. Al�m do mais, cabe ressaltar que os SGBDs hier�rquicos s�o �timos para consultas simples. J� consultas complexas, como aquelas em que � necess�rio realizar o cruzamento entre diversos tipos de dados, s�o muitas vezes mais bem atendidas por bancos de dados relacionais.

Nota DevMan 1. SGBDs Hier�rquicos - Os SGBDs hier�rquicos seguem um modelo de dados em que as informa��es s�o dispostas em blocos chamados de segmentos. Um segmento pode conter segmentos filhos, o que explica porque esses bancos s�o chamados de hier�rquicos. Muitos dos SGBDs que seguem esse modelo foram propostos e usados antes que a tecnologia relacional fosse anunciada. Apesar de antigos, eles continuam sendo bastante usados para o processamento de grandes volumes de transa��es. Para citar apenas alguns exemplos, v�rias empresas ligadas aos ramos banc�rio e de avia��o utilizam bases de dados hier�rquicas no back-end, executadas em plataforma mainframe. Ao fazer uma transfer�ncia financeira, � bem prov�vel que parte do processamento envolva dados armazenados de acordo com esse modelo.

Conclus�es

Neste artigo descrevemos diversos m�todos que podem ser usados para o armazenamento e consulta de dados hier�rquicos. Para exemplificar, apresentamos solu��es para duas consultas bastante comuns, uma que descobre os chefes de algum funcion�rio e outro que descobre quem s�o os seus subordinados. O material apresentado tem a inten��o de servir de base para a cria��o de solu��es que necessitem de dados hier�rquicos. Deixaremos para voc� o trabalho de descobrir como os m�todos podem ser usados para responder outros tipos de consulta, e o que deve ser feito para facilitar o armazenamento das informa��es.

Com um card�pio t�o variado de op��es, a pergunta que deve ser respondida � qual a melhor solu��o para o processamento de consultas hier�rquicas. Para respond�-la, � imperativo que outras perguntas sejam respondidas antes: Que tipos de consulta hier�rquica s�o necess�rios? Qual a frequ�ncia com que as consultas ser�o disparadas? Qual o volume de dados que ser� acessado? Quantas transa��es simult�neas dever�o ser suportadas? E por �ltimo, mas n�o menos importante, quanto sua empresa est� disposta a pagar por isso?

Pense bem antes de tomar a decis�o. Afinal, escolhas bem embasadas s�o fundamentais na carreira de algu�m. � importante lembrar que, al�m dos m�todos demonstrados, pessoas tamb�m caminham pelo organograma da empresa. Por isso fa�a as escolhas certas, e o pr�ximo relat�rio hier�rquico poder� estar de cara nova. Vai que seu nome apare�a alguns n�veis acima?

Links

Livro �Joe Celko"s Trees and Hierarchies in SQL for Smarties�, escrito por Joe Celko (2004).

Links �teis

Downloads do SQL Server
SQL:
SQL, � a linguagem de pesquisa declarativa padr�o para banco de dados relacional (base de dados relacional). Muitas das caracter�sticas originais do SQL foram inspiradas na �lgebra relacional.
MySQL

Saiba mais sobre SQL ;)

Conceitos e cria��o de views no SQL Server:
Veja neste artigo como trabalhar com views no SQL Server, aprendendo como utilizar os comandos CREATE, ALTER e DROP VIEW.
Curso de SQL:
A linguagem SQL � amplamente utilizada em diversos tipos de aplica��es que utilizem bancos de dados relacionais. Neste curso conheceremos os primeiros comandos da linguagem SQL (Structured Query Language), utilizada na estrutura��o e consulta de bancos de dados relacionais como MySQL e SQL Server.
Documenta��o: SQL: Cl�usula Where:
Nesta documenta��o voc� aprender� a utilizar o comando WHERE para adicionar filtros �s suas consultas SQL.

// 25 ANOS FORMANDO PROGRAMADORES

APRENDA A

PROGRAMAR DE VERDADE

Um caminho claro do zero ao avan�ado, com pr�tica de verdade.

Voc� constr�i projetos reais desde o come�o e sai sabendo programar sozinho, sem copiar c�digo de professor.

Forma��es completas

+40 Projetos

+5000 exerc�cios

+40 Tecnologias

Mentorias individuais

Suporte com IA

Comunidade de alunos

QUERO COME�AR AGORA

Confira outros conte�dos:

Por Devmedia Em 2012

Armazenando relacionamentos hier�rquicos em bancos de dados relacionais - Revista SQL Magazine 104

Estruturas de dados hier�rquicos s�o aquelas que costumam ser visualizadas na forma de �rvore, com liga��es entre n�s pai e seus respectivos n�s filhos. Existem formas bastante interessantes de tratar hierarquias e as conheceremos nesse artigo.