SQL JOIN: Tutorial Completo

Por que eu devo ler este artigo:

O objetivo desse artigo � apresentar a instru��o SELECT e seus detalhes de uso, principais caracter�sticas, algumas diferen�as na sua implementa��o entre os diferentes fabricantes de SGBD, assim como suas melhores pr�ticas e, desde o in�cio, como escrev�-la de forma que tenha sempre boa performance.

Nosso foco principal ser� a prepara��o de instru��es SELECT que tragam o resultado de duas ou mais tabelas, isto �, fa�am joins entre estas tabelas e retorne seus dados num �nico comando. Ser�o apresentados uma s�rie de exemplos para ilustrar e tornar o seu entendimento mais f�cil.

Com esses conceitos voc� descobrir� qual tipo de join se adapta corretamente ao seu problema, como escrev�-lo da forma correta, e tamb�m que pode escrever muito menos linhas de c�digo na sua aplica��o porque uma instru��o SELECT poder� fazer grande parte desse trabalho para voc�.

Portanto, se voc� � um desenvolvedor, voc� j� utilizou ou utilizar� essa instru��o. Assim, nada melhor do que conhecer seus detalhes e como utiliz�-la de maneira que torne sua aplica��o o mais eficiente poss�vel no acesso aos seus dados.

Em um artigo publicado na edi��o 129, fizemos uma introdu��o � instru��o SELECT da linguagem SQL. Nele apresentamos sua forma b�sica de uso de tal modo que voc� j� conseguisse escrever as primeiras instru��es, recuperando dados do seu banco de dados, utilizando fun��es muito �teis no seu dia a dia.

Este artigo avan�ar� mais profundamente nessa mesma instru��o SELECT. Vamos colocar seu conhecimento da instru��o em seu n�vel intermedi�rio. Suficiente para utiliz�-la em 90% das situa��es enfrentadas diariamente por um desenvolvedor.

Novamente, utilizaremos as melhores pr�ticas como nossa orienta��o primordial. Como melhores pr�ticas voc� poder� entender: instru��es simples, escritas de forma clara e correta, e apresentando a melhor performance poss�vel.

O foco nesse artigo ser� como apresentar os dados de duas ou mais tabelas em uma �nica instru��o, isto �, como montar joins. Vamos apresentar e conceituar os diferentes tipos de joins e suas diferentes formas de escrev�-los.

Modelo de dados de exemplos

O assunto central deste artigo s�o as v�rias formas de join, ou combina��o de v�rias tabelas em uma �nica instru��o. Para se combinar tabelas, � primordial conhecer como estas tabelas foram modeladas e se relacionam.

N�o conseguir�amos escrever um join sem saber quais s�o as colunas de duas tabelas que definem o seu relacionamento. Portanto, para termos sucesso e clareza em nossos exemplos, vamos apresentar o modelo de dados que ser� utilizado para desenvolvermos as instru��es SELECT ao longo desse artigo.

Na Figura 1 � poss�vel ver o esquema simplificado dos relacionamentos entre as tabelas. Nosso objetivo aqui n�o � falar sobre este tipo de esquema, chamado de Modelo de Entidades e Relacionamentos, que tem muito mais s�mbolos do que os apresentados aqui. Por isso, apresentaremos rapidamente o que ele est� descrevendo.

Nesse conjunto de tabelas, temos a listagem dos materiais (tabela Materiais) utilizados por uma empresa fict�cia para a qual vamos montar nossos exemplos. Cada um desses materiais � comprado de uma empresa fornecedora (tabela Fornecedores).

Temos tamb�m os pedidos de compra que foram feitos para cada fornecedor (tabela Pedidos), com seus respectivos itens (tabela �Itens x Pedidos�), isto �, quais materiais foram solicitados nos pedidos. A �ltima tabela � a tabela de unidades. Nela est�o as defini��es das unidades de medida utilizadas para contar ou medir os itens.

As setas que ligam uma tabela, ou entidade, as outras representam os relacionamentos que existem entre elas. O sentido da seta indica qual tabela � pai e qual � filha nesse relacionamento, estando a filha do lado da seta.

Para ficar mais claro, existe uma seta entre a tabela de Fornecedores e Materiais, apontando para tabela Materiais. Isto indica que existe um relacionamento entre as duas tabelas e que a tabela Materiais � filha da tabela Fornecedores.

Assim, a tabela Materiais dever� possuir uma coluna que identifique qual a empresa fornecedora � a que oferece aquele material. Na lista de atributos, ou colunas, das tabelas apresentadas, � poss�vel notar que existe uma coluna cod_fornecedor na tabela Materiais e este � exatamente o prop�sito dela, indicar quem � o seu fornecedor.

A inten��o deste pequeno modelo n�o � sermos exaustivos em todas as possibilidades de neg�cio que poderiam ser definidas nesse conjunto de tabelas, mas apenas utiliz�-las como exemplo. S� para exemplificar uma regra de neg�cio que n�o � atendida por este modelo, um Material s� pode ser fornecido por uma empresa fornecedora. N�o existe aqui como armazenar ou representar um material oferecido por mais de um fornecedor. A seguir s�o apresentados os atributos de cada tabela:

Fornecedores: cod_fornecedor, nome, cidade_sede, grupo_cod_fornecedor;
Materiais: cod_material, cod_fornecedor, nome, descricao, quant_estoque, quant_estoque_min, cod_unidade;
Pedidos: num_pedido, cod_fornecedor, data_pedido, data_recebimento, quant_itens, valor_total;
Itens_Pedidos: num_pedido, cod_material, quant_pedida, valor_unitario;
Unidades: cod_unidade, nome_unidade.

**Figura 1**. Modelo de relacionamento das tabelas dos exemplos desse artigo

Note que na lista de colunas de cada tabela uma ou mais colunas ou atributos est�o destacadas em negrito. Elas s�o as colunas chamadas de chave prim�ria de cada tabela, isto �, as colunas que identificar�o unicamente cada linha de dados de cada tabela. A coluna destacada na tabela Fornecedores � a cod_fornecedor. Isto significa que cada fornecedor dever� ter um c�digo �nico, representado nessa coluna, e esse c�digo identificar� apenas um fornecedor.

A coluna cod_fornecedor aparece tamb�m na tabela Materiais. Isto serve para identificarmos que aquele material � oferecido pelo fornecedor que aparecer com o c�digo ao lado. A coluna cod_fornecedor, quando aparece na tabela Materiais para definir o relacionamento, � chamada de chave estrangeira. A Listagem 1 apresenta os dados de exemplo desse conjunto de tabelas.


      select * from fornecedores;
      +-----------+-------------------------------------------+----------------+----------------------+
      | cod_forne | nome                                      | cidade_sede    | grupo_cod_fornecedor |
      +-----------+-------------------------------------------+----------------+----------------------+
      | ABC       | ABC Materiais Eletricos                   | Vitoria        | NULL                 |
      | XYZ       | XYZ Materiais de Escritorio               | Rio de Janeiro | HiX                  |
      | Hidra     | Hidra Materiais Hidraulicos               | Sao Paulo      | HiX                  |
      | HiX       | HidraX Materiais El�tricos e Hidraulicos  | Sao Paulo      | NULL                 |
      +-----------+-------------------------------------------+----------------+----------------------+
       
      select cod_material, cod_fornecedor, nome, descricao from materiais order by cod_material;
      +--------------+----------------+----------------------------+---------------------------------+
      | cod_material | cod_fornecedor | nome                       | descricao                       |
      +--------------+----------------+----------------------------+---------------------------------+
      |          123 | ABC            | Tomada eletrica 10A Nova   | Tomada eletrica 10A padrao novo |
      |          234 | ABC            | Disjuntor 25A              | Disjuntor eletrico 25A          |
      |          345 | XYZ            | Resma Papel A4             | Resma papel branco A4           |
      |          456 | XYZ            | Toner Imp HR5522           | Toner impressora HR5522         |
      |          678 | Hidra          | Cano PVC 1/2               | Cano PVC 1/2 pol                |
      |          679 | Hidra          | Cano PVC 3/4               | Cano PVC 3/4 pol                |
      |          680 | Hidra          | Medidor hidr 1/2           | Medidor hidraulico 1/2 pol      |
      |          681 | Hidra          | Joelho 1/2                 | Conector Joelho 1/2 pol         |
      |          682 | Hidra          | Junta 1/2                  | Cano PVC 1/2 pol                |
      |         1234 | ABC            | Tomada eletrica 20A Nova   | Tomada eletrica 20A padrao novo |
      |         2345 | XYZ            | Caneta Azul                | Caneta esferografica azul       |
      |         4567 | XYZ            | Grapeador                  | Grampeador mesa pequeno         |
      |         4568 | XYZ            | Caneta Marca Texto Amarela | Caneta Marca Texto Amarela      |
      |         4569 | XYZ            | Lapis HB                   | Lapis Preto HB                  |
      +--------------+----------------+----------------------------+---------------------------------+
       
      select cod_material, quant_estoque, quant_estoque_min, 
      cod_unidade from materiais order by cod_material;
      +--------------+---------------+-------------------+-------------+
      | cod_material | quant_estoque | quant_estoque_min | cod_unidade |
      +--------------+---------------+-------------------+-------------+
      |          123 |            12 |                 5 | UN          |
      |          234 |            10 |                 5 | UN          |
      |          345 |            32 |                20 | CX12        |
      |          456 |             6 |                10 | UN          |
      |          678 |             6 |                10 | NULL        |
      |          679 |             8 |                10 | NULL        |
      |          680 |             3 |                 2 | NULL        |
      |          681 |            18 |                15 | NULL        |
      |          682 |             0 |                15 | NULL        |
      |         1234 |             8 |                 5 | UN          |
      |         2345 |            80 |               120 | UN          |
      |         4567 |             5 |                 5 | UN          |
      |         4568 |             6 |                15 | CX100       |
      |         4569 |            15 |                25 | UN          |
      +--------------+---------------+-------------------+-------------+
       
      select * from pedidos;
      +------------+----------------+-------------+------------------+-------------+-------------+
      | num_pedido | cod_fornecedor | data_pedido | data_recebimento | quant_itens | valor_total |
      +------------+----------------+-------------+------------------+-------------+-------------+
      |        111 | XYZ            | 2015-02-25  | 2015-03-31       |         200 |       75.00 |
      |        115 | Hidra          | 2014-02-10  | 2014-04-10       |          50 |       65.00 |
      |        120 | XYZ            | 2015-03-01  | 2015-03-21       |         200 |       75.00 |
      +------------+----------------+-------------+------------------+-------------+-------------+
       
      select * from itens_pedidos;
      +------------+--------------+--------------+----------------+
      | num_pedido | cod_material | quant_pedida | valor_unitario |
      +------------+--------------+--------------+----------------+
      |        111 |         2345 |          100 |           0.50 |
      |        111 |         4569 |          100 |           0.25 |
      |        115 |          682 |           50 |           1.30 |
      |        120 |         4567 |            5 |          76.00 |
      +------------+--------------+--------------+----------------+
       
      select * from unidades;
      +-------------+------------------------+
      | cod_unidade | nome                   |
      +-------------+------------------------+
      | UN          | Unidades               |
      | KG          | Kilogramas             |
      | LT          | Litros                 |
      | CX12        | Caixa com 12 unidades  |
      | CX100       | Caixa com 100 unidades |
      +-------------+------------------------+

Listagem 1. Dados das tabelas de exemplo

Teoria de conjuntos

Quando estamos falando do acesso aos dados de uma base de dados, eles podem serem chamados conjuntos, conjuntos de dados. Ao decorrer deste artigo vamos utilizar desta compara��o para facilitar o entendimento dos exemplos.

A teoria dos conjuntos estuda cole��es de elementos. Associando com bancos de dados, nossos elementos s�o os dados das tabelas. Utilizando nosso modelo de dados definido para este artigo, podemos identificar alguns exemplos de conjuntos de dados:

O conjunto dos fornecedores que receberam pedido nos �ltimos seis meses;
O conjunto dos materiais com o estoque zerado;
O conjunto dos fornecedores que atenderam aos pedidos em at� uma semana;

E, relembrando os conceitos combina��o de conjuntos temos:

Uni�o de conjuntos � O resultado da uni�o de dois conjuntos A e B � um outro conjunto com todos os elementos de A e de B;
Interse��o de conjuntos � O resultado da interse��o de dois conjuntos A e B s�o apenas os elementos que s�o coincidentes nos dois conjuntos, isto �, os elementos que existem em ambos simultaneamente;
Diferen�a de conjuntos � O resultado da diferen�a do conjunto A menos o conjunto B s�o os elementos do conjunto A excluindo aqueles que tamb�m existem no conjunto B;
Produto cartesiano de conjuntos � O resultado do produto cartesiano entre os conjuntos A e B s�o pares de elementos, um de cada conjunto, combinando todos os elementos de A com todos os elementos de B;
Rela��o de pertin�ncia � � quando um conjunto est� contido em outro conjunto. O conjunto A est� contido em um conjunto B quando todos os elementos de A tamb�m fazem parte do conjunto B. Em outras palavras, tamb�m podemos dizer que o conjunto A � um subconjunto do conjunto B.

SELECT FROM duas ou mais tabelas

A primeira caracter�stica da instru��o SELECT que gostar�amos de apresentar nesse artigo � o caso mais simples de join, ou como se obter informa��es de mais de uma tabela simultaneamente no mesmo comando. Ou, como unir ou juntar as informa��es de mais de uma tabela na mesma instru��o.

A sintaxe da instru��o SELECT com uso de joins �:


      SELECT <lista de colunas>
      FROM <nome de uma ou mais tabelas>
      WHERE <lista de condi��es>

O principal item a ser destacado agora � que, na cl�usula FROM, em vez de apresentarmos o nome de apenas uma tabela, podemos incluir uma lista de tabelas, separadas por v�rgulas. Temos ainda a mesma lista de colunas ap�s a palavra SELECT e os mesmos tipos de condi��o encontradas na cl�usula WHERE.

Come�ando diretamente com um exemplo, se n�s quis�ssemos trazer a lista de todos os materiais junto ao nome dos seus fornecedores correspondentes, ter�amos a instru��o escrita da seguinte forma:


      SELECT fornecedores.nome, materiais.nome
      FROM fornecedores, materiais;

Al�m da lista das duas tabelas, fornecedores e materiais, na cl�usula FROM, temos ainda uma outra caracter�stica na lista de colunas seguidas � palavra SELECT: cada coluna est� prefixada com o nome da sua respectiva tabela. Isso s� � necess�rio porque a coluna �nome� existe nas duas tabelas. Por esse motivo, temos que dizer para o SGBD de qual coluna, de qual tabela, estamos nos referenciando.

Tudo seria muito simples se pud�ssemos parar um �join� por aqui, por�m, o comando n�o pode ser escrito apenas dessa forma. Desse jeito, o SGBD n�o sabe como as duas tabelas se relacionam.

E sem dizermos como as tabelas Fornecedores e Materiais se relacionam, o SGBD vai interpretar que ele deve trazer para voc� todos os materiais para cada linha de fornecedor que ele encontrar.

Isto �, ele vai entender que o relacionamento existente �: todas as linhas da tabela de fornecedores se relacionam com todas as linhas da tabela de materiais e isso n�o � verdade. Na realidade, um material � oferecido por apenas um fornecedor e n�s precisamos dizer isso ao SGBD.

E a forma de dizer isso � incluindo uma restri��o na cl�usula WHERE onde vamos dizer para o banco de dados que ele deve nos trazer apenas os materiais relacionados aos seus fornecedores correspondentes, ou de outra forma, ele deve apresentar todos os fornecedores e os materiais que cada um tem dispon�vel para comercializar. Assim, nosso comando complementado com a cl�usula WHERE, ficaria conforme a Listagem 2.


      SELECT fornecedores.nome �Nome Fornecedor�, materiais.nome �Nome Material�
      FROM fornecedores, materiais
      WHERE fornecedores.cod_fornecedor = materiais.cod_fornecedor;

Listagem 2. Exemplo utilizando cl�usula Where

Esta restri��o diz que o banco s� deve nos retornar os nomes dos fornecedores e materiais para as linhas onde o c�digo do fornecedor seja igual em ambas as tabelas. O resultado da execu��o dessa instru��o est� representado na Listagem 3.


      +--------------------------------+----------------------------------+
      | Nome Fornecedor                 | Nome Material                   |
      +--------------------------------+----------------------------------+
      | ABC Materiais Eletricos         | Tomada eletrica 10A Nova        |
      | ABC Materiais Eletricos         | Tomada eletrica 20A Nova        |
      | ABC Materiais Eletricos         | Disjuntor 25A                   |
      | XYZ Materiais de Escritorio   | Caneta Azul                       |
      | XYZ Materiais de Escritorio   | Resma Papel A4                    |
      | XYZ Materiais de Escritorio   | Toner Imp HR5522                  |
      | XYZ Materiais de Escritorio   | Grapeador                         |
      | XYZ Materiais de Escritorio   | Caneta Marca Texto Amarela        |
      | XYZ Materiais de Escritorio   | Lapis HB                          |
      | Hidra Materiais Hidraulicos   | Cano PVC 1/2                      |
      | Hidra Materiais Hidraulicos   | Cano PVC 3/4                      |
      | Hidra Materiais Hidraulicos   | Medidor hidr 1/2                  |
      | Hidra Materiais Hidraulicos   | Joelho 1/2                        |
      | Hidra Materiais Hidraulicos   | Junta 1/2                         |
      +-------------------------------+-----------------------------------+

Listagem 3. Lista dos fornecedores e materiais oferecidos

Observe que aqui neste primeiro exemplo j� estamos utilizando a defini��o do relacionamento entre a tabela de Fornecedores e Materiais que apresentamos no modelo de dados.

Este � um dos conceitos principais de bancos de dados e que, no momento em que escrevemos uma instru��o SELECT, deve estar em nossa mente, ou ao nosso alcance para consulta.

Se cod_fornecedor � a coluna que define o relacionamento entre as tabelas, ent�o esta restri��o tem que ser informada ao SGBD para que o relacionamento seja feito de forma correta. Foi por esse motivo que a cl�usula WHERE foi inserida, informando que o cod_fornecedor das duas tabelas deve ser igual.

Observe tamb�m que colocamos �Nome Fornecedor� e �Nome Material� ao lado do nome do fornecedor e do material, separados apenas por um espa�o.

Estes s�o considerados nomes alternativos para as colunas, ou alias. O primeiro e principal objetivo desses alias � dar um nome melhor a cada coluna.

J� descrevemos a l�gica da exist�ncia da restri��o �fornecedores.cod_fornecedor = materiais.cod_fornecedor�, mas n�o falamos ainda sobre o porqu� esta restri��o melhora a performance do comando.

Aqui j� entra um conceito de implementa��o f�sica do banco de dados e que normalmente � criado na base de dados de todas as aplica��es antes dos desenvolvedores terem acesso a elas. Normalmente, o desenvolvedor n�o precisaria saber disso, pois o administrador de banco de dados (DBA) j� fez esse trabalho e j� entrega a base de dados dispon�vel com essa caracter�stica.

Este conceito �: para toda chave prim�ria e toda chave estrangeira definidas em uma base de dados, devem existir �ndices de acesso correspondentes a elas. Sem nos aprofundarmos muito, conceitualmente os �ndices s�o aceleradores de acesso a uma tabela do banco de dados.

Quando o DBA sabe que uma tabela ser� muito acessada por uma coluna especificamente, ele cria um �ndice para esta coluna. Isso faz com que o SGBD encontre a linha que voc� precisa de maneira muito mais eficiente do que ler todas as linhas da tabela para trazer as que voc� solicitou.

E, por defini��o, o DBA cria �ndices para todas as chaves prim�rias e estrangeiras de todas as tabelas. Por isso, a performance do comando, quando � inclu�da a restri��o pelas chaves prim�rias e secund�rias, tem uma performance melhor. O SGBD saber� se resolver de uma forma mais eficiente.

Neste momento, tamb�m � importante notar que normalmente n�o se relacionam tabelas por colunas que n�o sejam as chaves prim�rias e secund�rias das respectivas tabelas. Normalmente, este relacionamento n�o far� sentido se for feito por outras colunas. Mas, existir�o exemplos onde, se voc� n�o conhecer o modelo de relacionamentos entre as tabelas de uma base de dados, voc� ser� tentado a estabelecer um relacionamento por outras colunas. Isso n�o s� poder� trazer para voc� um resultado equivocado como tamb�m n�o ter� uma boa performance.

Vamos introduzir neste ponto um novo conceito que ajudar� muito na clareza e facilidade de leitura da instru��o SELECT: o alias do nome das tabelas. O alias � um sin�nimo que voc� atribui a uma tabela. � uma outra forma de se referenciar ao nome da mesma. Quando escrevemos a instru��o, prefixamos as colunas com os nomes das respectivas tabelas.

Simples e claro at� aqui porque nosso exemplo possui apenas duas colunas. Se a instru��o possu�sse vinte colunas e voc� tivesse que prefixar o nome das respectivas tabelas antes de cada uma delas, seria um desperd�cio de espa�o e tempo e, al�m disso, a legibilidade do comando estaria prejudicada. Por isso existe o alias. Veja a seguir o mesmo exemplo reescrito utilizando um alias simples para cada tabela:


      SELECT f.nome, m.nome
      FROM fornecedores f, materiais m
      WHERE f.cod_fornecedor = m.cod_fornecedor;

Note que colocamos uma letra �f� ap�s apresentarmos a tabela fornecedores na cl�usula FROM e da mesma forma, colocamos uma letra �m� ap�s a tabela materiais. O �f� e �m� s�o os alias que criamos para as tabelas fornecedores e materiais respectivamente. Poderia ser qualquer nome ou abrevia��o, n�o apenas uma letra.

Dessa forma, apresentado ap�s o nome de uma tabela ele ser� o alias para aquela tabela e o SGBD saber� de qual tabela voc� est� falando quando fizer refer�ncia a ele. Assim, todas as refer�ncias �s tabelas foram substitu�das pelos alias correspondentes dentro da instru��o, tornando o comando mais claro e leg�vel.

Inner Joins e Outer Joins

Continuando nossa defini��o de como �juntar� as informa��es de duas ou mais tabelas, existe um conceito muito importante que devemos apresentar antes de prosseguir.

No exemplo que fizemos at� aqui, listamos os nomes dos fornecedores e respectivos nomes dos materiais. Note que listamos apenas as informa��es de fornecedores que estavam associadas aos respectivos materiais, isto �, quando os fornecedores e materiais existiam e eram iguais em ambas as tabelas. Este conceito de join � conhecido como inner join. Em um relacionamento desse tipo, somente ser�o listadas as linhas de fornecedores e materiais correspondentes que existam em ambas as tabelas.

Pode existir, por�m, um caso onde gostar�amos de listar todas as linhas de uma tabela mesmo que n�o exista uma linha correspondente na tabela relacionada. Por exemplo, podemos querer a lista de todos os fornecedores junto com a soma de todos os pedidos realizados para eles, mas queremos todos os fornecedores mesmo aqueles que nunca tenhamos pedidos feitos para eles.

Para isso, precisamos fazer o join exatamente como realizado, por�m com uma diferen�a sutil, para informar ao SGBD que queremos todos os fornecedores. Veja na Listagem 4 como ficaria este exemplo utilizando o inner join.


      SELECT f.nome, SUM(p.valor_total)
      FROM fornecedores f, pedidos p
      WHERE f.cod_fornecedor = p.cod_fornecedor
      GROUP BY f.nome;

Listagem 4. Exemplo utilizando inner join

Se o comando for executado dessa forma, o SGBD retornar� a lista dos fornecedores que j� fizeram algum tipo de pedido e o seu total ao lado de cada um. Mas n�o � exatamente isso que queremos. Queremos todos os fornecedores, mesmo que nunca tenham feito pedidos. A altera��o sutil est� na Listagem 5.


      SELECT f.nome, SUM(p.valor_total)
      FROM fornecedores f, pedidos p
      WHERE f.cod_fornecedor = p.cod_fornecedor(+)
      GROUP BY f.nome;

Listagem 5. Exemplo utilizando outer join

Note o �(+)� ao lado do c�digo do fornecedor, da tabela dos pedidos. Esta nota��o utilizada pelo SGBD Oracle, diz para que tenhamos todas as linhas de fornecedores, mesmo que n�o existam pedidos correspondentes, isto �, neste caso os pedidos sejam opcionais. O resultado da execu��o deste comando est� na Listagem 6.


      +---------------------------------------------+---------------------+
      | nome                                         | SUM(p.valor_total) |
      +---------------------------------------------+---------------------+
      | ABC Materiais Eletricos                      |               NULL |
      | Hidra Materiais Hidraulicos                  |              65.00 |
      | HidraX Materiais El�tricos e Hidraulicos     |               NULL |
      | XYZ Materiais de Escritorio                  |             150.00 |
      +---------------------------------------------+---------------------+

Listagem 6. Exemplo de outer join

Sintaxes diferentes para Inner e Outer Joins

Os exemplos apresentados funcionam e s�o a forma mais clara de se apresentar inner e outer joins. Utilizando sempre a cl�usula WHERE para colocar as restri��es de sele��o, incluindo as restri��es de join. Esta nota��o, conhecida como nota��o impl�cita, para inner joins existe para qualquer SGBD, porque ela n�o possui nenhuma diferen�a de uma cl�usula WHERE tradicional. Por�m, o exemplo de outer join apresentado utiliza a nota��o impl�cita oferecida pelo SQL do SGBD Oracle.

Outros fornecedores de SGBD possuem sintaxes diferentes para estas nota��es impl�citas. O SQL Server, por exemplo, utiliza o �*=� na compara��o da cl�usula WHERE para indicar que a tabela que est� � esquerda � a que se quer todos os registros.

O SQL ANSI, por�m, possui uma sintaxe adicional para joins, chamada de nota��o expl�cita, que padroniza a sintaxe de todos os tipos de join, onde os mesmos ficam representados na cl�usula FROM, quando voc� declara as tabelas, e n�o na cl�usula WHERE como apresentamos nos exemplos.

Geralmente, as pessoas n�o costumam gostar muito desta sintaxe porque ela fica cada vez mais complexa � medida que voc� acrescenta tabelas ao join e isso dificulta a leitura. Mas esta � uma quest�o de padroniza��o, e devemos aqui apresentar esta sintaxe diferenciada, porque voc� certamente passar� por ela ao longo da sua vida profissional. Existem ainda SGBDs que n�o implementam nenhum tipo de nota��o impl�cita para outer joins. Por este motivo, � mais importante ainda que voc� a conhe�a.

Nos exemplos que apresentamos, o inner join foi introduzido utilizando a nota��o impl�cita. Essa instru��o seria representada na nota��o expl�cita da seguinte forma:


      SELECT f.nome, m.nome
      FROM fornecedores f INNER JOIN materiais m
           ON f.cod_fornecedor = m.cod_fornecedor;

Note que a cl�usula WHERE foi suprimida nesse caso. Esta cl�usula s� apareceria se quis�ssemos realmente fazer uma restri��o dos dados por algum valor espec�fico.

Nos exemplos que apresentamos, o outer join foi introduzido utilizando a nota��o impl�cita. Essa instru��o seria representada na nota��o expl�cita conforme a Listagem 7.


      SELECT f.nome, SUM(p.valor_total)
      FROM fornecedores f LEFT OUTER JOIN pedidos p
           ON f.cod_fornecedor = p.cod_fornecedor
      GROUP BY f.nome;

Listagem 7. Exemplo utilizando outer join explicitamente

Existem duas grandes vantagens na nota��o expl�cita: sua clareza e padroniza��o. E, de novo, ela � comum em todos os SGBDs do mercado.

Um exemplo de join de v�rias tabelas

O nosso exemplo de joins de v�rias tabelas ser� um relat�rio de todos os pedidos do m�s de fevereiro incluindo as informa��es dos pedidos e os itens dos pedidos.

Este � um exemplo que parece bem simples, basta fazer um join das tabelas de pedidos e de itens dos pedidos e apresentar todas as informa��es de ambas as tabelas. Observe a Listagem 8.


      SELECT p.*, ip.*
      FROM pedidos p, itens_pedidos ip
      WHERE p.num_pedido = ip.num_pedido AND
        year(data_pedido) = 2015 AND
        month(data_pedido) = 2;

Listagem 8. Exemplo de join simples

Temos o resultado dessa instru��o na Listagem 9.


      +--------------+------------------+--------------+---------------------+--------------+------+
      | num_pedido | cod_fornecedor | data_pedido | data_recebimento | quant_itens | valor_total |
     +--------------+------------------+---------------+---------------------+--------------+------+
      |    111     | XYZ            | 2015-02-25  | 2015-03-31       |         200 |       75.00 |
      |    111     | XYZ            | 2015-02-25  | 2015-03-31       |         200 |       75.00 |
     +--------------+------------------+---------------+---------------------+--------------+------+
       
      +--------------+---------------+----------------+----------------+
      | num_pedido | cod_material | quant_pedida | valor_unitario |
      +--------------+---------------+----------------+----------------+
      |    111     |         2345 |          100 |           0.50 |
      |    111     |         4569 |          100 |           0.25 |
      +--------------+---------------+----------------+----------------+

Listagem 9. Join simples de pedidos e itens dos pedidos (Sintaxe MySQL)

Mas n�o temos alguma coisa estranha? O que s�o esses v�rios c�digos listados? Como saber quem s�o os fornecedores e o nome dos materiais de cada pedido? Estas informa��es n�o est�o nas tabelas de pedidos e itens dos pedidos, elas est�o nas tabelas de fornecedores e materiais.

Assim, para incluir essas informa��es temos que incluir as tabelas onde elas existem: o nome dos fornecedores na tabela de fornecedores, o nome dos materiais na tabela de materiais, etc.

O comando completo ficaria conforme a Listagem 10, e seu resultado conforme a Listagem 11.


    SELECT f.nome, p.num_pedido, p.data_pedido, p.data_recebimento,
      p.quant_itens, p.valor_total, m.nome, ip.quant_pedida,
      u.nome, ip.valor_unitario
    FROM pedidos p,
      itens_pedidos ip,
      fornecedores f,
      materiais m,
      unidades u
    WHERE p.num_pedido = ip.num_pedido AND
      p.cod_fornecedor = f.cod_fornecedor AND
      ip.cod_material = m.cod_material AND
      m.cod_unidade = u.cod_unidade AND
        year(data_pedido) = 2015 AND
        month(data_pedido) = 2;

Listagem 10. Exemplo de join de pedidos e itens


      +------------------------------+--------------+---------------+--------------------+-------+
      | nome                        | num_pedido | data_pedido | data_recebimento | quant_itens |
      +------------------------------+--------------+---------------+--------------------+-------+
      | XYZ Materiais de Escritorio |        111 | 2015-02-25  |   2015-03-31     |         200 |
      | XYZ Materiais de Escritorio |        111 | 2015-02-25  |   2015-03-31     |         200 |
      +------------------------------+--------------+---------------+--------------------+-------+
       
      +------------+--------------+---------------+-----------+----------------+
      | valor_total | nome         | quant_pedida | nome      | valor_unitario |
      +------------+--------------+---------------+-----------+----------------+
      |       75.00 | Caneta Azul |          100  | Unidades  |           0.50 |
      |       75.00 | Lapis HB    |          100  | Unidades  |           0.25 |
      +-------------+-------------+---------------+------------+----------------+

Listagem 11. Join de pedidos e itens dos pedidos complementado com nomes dos fornecedores e materiais

Note que para apresentar todas as informa��es textuais que precis�vamos, tivemos que unir cinco tabelas, tr�s al�m das tabelas bases iniciais. Note tamb�m que existe uma condi��o de join para cada uma delas.

Seguindo o modelo de relacionamentos das tabelas, temos a tabela Pedidos que se relaciona com a tabela itens de pedidos. Isso est� representado na cl�usula WHERE por �p.num_pedido = ip.num_pedido�.

Para obter o nome dos fornecedores, tivemos que incluir o relacionamento de pedidos e fornecedores representado por �p.cod_fornecedor = f.cod_fornecedor�.

J� os materiais aparecem ao n�vel dos itens dos pedidos e para relacion�-los inclu�mos �ip.cod_material = m.cod_material�. E, finalmente, os itens dos pedidos tamb�m possuem unidades, que s�o descritas na tabela de unidades, que se relacionam com os materiais e foram representados por �m.cod_unidade = u.cod_unidade�.

Observe tamb�m que inclu�mos na lista dos campos a retornar o nome dos fornecedores (f.nome), materiais (m.nome), e unidades (u.nomes).

O resultado apresentado n�o tem a apar�ncia de um relat�rio, n�o possui uma formata��o apresent�vel e tamb�m todas as informa��es da tabela de pedidos est�o aparecendo repetidamente em cada linha correspondente a cada item do pedido. Isso � assim mesmo.

Esses s�o os dados que voc� utilizar� em seu programa, ou no seu software gerador de relat�rios, para apresenta��o. Os dados repetidos ser�o agrupados pelo seu programa, ou pelo gerador de relat�rios, para serem apresentados uma �nica vez. A sintaxe que utilizamos para as fun��es de ano e m�s, e que s�o a nossa �nica restri��o real dos dados que queremos, s�o do SGBD MySQL.

Como ficaria este join utilizando a nota��o expl�cita? Observe a Listagem 12.


    SELECT f.nome, p.num_pedido, p.data_pedido, p.data_recebimento,
       p.quant_itens, p.valor_total, m.nome, ip.quant_pedida,
       u.nome, ip.valor_unitario
    FROM pedidos p
    INNER JOIN fornecedores f    ON p.cod_fornecedor = f.cod_fornecedor
    INNER JOIN itens_pedidos ip ON p.num_pedido = ip.num_pedido
    INNER JOIN materiais m       ON ip.cod_material = m.cod_material
    INNER JOIN unidades u        ON m.cod_unidade = u.cod_unidade
    WHERE year(data_pedido) = 2015 AND
    month(data_pedido) = 2;

Listagem 12. Exemplo utilizando join explicitamente

Utilizar a nota��o impl�cita ou expl�cita pode ser uma quest�o de gosto, de clareza do texto da instru��o ou uma quest�o de padroniza��o. Algumas empresas podem solicitar que os desenvolvedores sigam um padr�o na elabora��o das queries. Todos, por�m, funcionam da mesma forma.

Por que o Join?

Aqui entra um questionamento interessante que povoa as mentes de muitos desenvolvedores: Por que ent�o n�o fazer duas queries separadas em vez de apenas uma? Por que agrupar todas as informa��es de pedidos e itens dos pedidos em uma �nica query, mais complexa, que tamb�m me trar� um esfor�o de programa��o razo�vel, se eu posso ter duas queries, uma delas, um SELECT, listando apenas os pedidos, e para cada pedido uma segunda query para selecionar os seus itens?

A resposta para este questionamento � uma s�: Performance! A cada vez que o SGBD tem uma nova query para execu��o, ele tem que seguir os seguintes passos, e que podem variar de um fabricante para outro:

Avaliar a query sintaticamente e semanticamente;
Montar o plano de acesso aos dados, isto �, decidir como os dados ser�o acessados e recuperados para voc�;
Executar a query.

Os dois primeiros itens s�o tamb�m conhecidos como �parse� da instru��o. Eles normalmente consomem d�cimos ou cent�simos de segundo. O terceiro item, a execu��o da query, � o que normalmente consome um pouco mais, mas normalmente n�o mais que alguns poucos segundos se a instru��o estiver bem escrita.

A princ�pio, somente com estas informa��es, n�o haveria porque fazer o join. Quem n�o pode aguardar dois ou tr�s segundos por um relat�rio? O argumento de performance teria ido por �gua abaixo se n�o houvessem a seguintes perguntas: Quantos pedidos vamos tratar? Quantos itens existem em m�dia para cada pedido?

Se a resposta for uma dezena de pedidos, realmente n�o teremos problemas de performance. Para falar a verdade, n�o precisar�amos nem desenvolver uma aplica��o para isso. Mas, e se a resposta for que temos pedidos na ordem dos milhares por m�s? Tomando como exemplo um montante de aproximadamente dois mil pedidos mensais, com uma m�dia de cinco itens por pedido, se separ�ssemos este join em duas queries, uma de pedidos e outra para os itens de cada pedido, ter�amos a primeira sempre executando uma �nica vez.

Sem problemas. Mas, a segunda seria executada duas mil vezes. Se esta segunda instru��o demorar um segundo para executar, o tempo total de execu��o da segunda query 2000 vezes seria de 2000 segundos! Normalmente ningu�m est� disposto a aguardar mais de 30 minutos para ter o resultado de um relat�rio simples como este.

Mas ainda vamos ter algu�m que afirme: mas o join de todas essas tabelas numa �nica query vai demorar mais para executar que se tiv�ssemos duas queries separadas.

Ainda assim, por que juntar? E a resposta �: sim, o join vai demorar um pouco mais. Mas se ele demorar mais do que 3 segundos, j� poder�amos dizer que tem algo mais errado com o seu banco de dados.

Portanto, o SGDB executar para voc� o join de v�rias tabelas e te retornar o resultado todo de uma vez, em 99% dos casos ser� mais r�pido que executar v�rias queries repetidamente. Portanto, o esfor�o vale a pena.

Outras sintaxes de Outer Joins

No exemplo de outer join que mostramos, a restri��o f.cod_fornecedor = p.cod_fornecedor (+), da sintaxe impl�cita, fazia com que troux�ssemos todos os fornecedores, mesmo que n�o houvessem pedidos correspondentes. Esta caracter�stica foi representada na sintaxe expl�cita, na cl�usula FROM, dessa forma: FROM fornecedores f LEFT OUTER JOIN pedidos p ON f.cod_fornecedor = p.cod_fornecedor.

Mas e se quis�ssemos o contr�rio? Se quis�ssemos ter a lista de todos os pedidos, mesmo que n�o existissem fornecedores correspondentes? Isso n�o faz muito sentido no nosso exemplo, mas tecnicamente � poss�vel. Voc� j� poderia dizer que, na forma impl�cita, basta colocar o (+) do outro lado da igualdade, fazendo f.cod_fornecedor(+) = p.cod_fornecedor. O que � verdade e funciona. A� ter�amos a instru��o completa desta forma:


      SELECT f.nome, SUM(p.valor_total)
      FROM fornecedores f, pedidos p
      WHERE f.cod_fornecedor(+) = p.cod_fornecedor;

Mas temos ainda a forma expl�cita de nota��o do outer join. E nessa forma ainda ter�amos duas formas de represent�-lo. A primeira, invertendo as tabelas Fornecedores e Pedidos na cl�usula FROM, em rela��o ao exemplo apresentado:


    SELECT f.nome, SUM(p.valor_total)
    FROM pedidos p LEFT OUTER JOIN fornecedores f
       ON f.cod_fornecedor = p.cod_fornecedor;

E a segunda utilizando uma outra sintaxe do outer join, o right outer join. Esta sintaxe diz ao SGBD para fazer exatamente o que precisamos, considerar a tabela da direita, pedidos, como a que ter� todas as suas linhas apresentadas, independentemente de existirem fornecedores correspondentes. A instru��o seria ent�o escrita desta forma:


    SELECT f.nome, SUM(p.valor_total)
    FROM fornecedores f RIGHT OUTER JOIN pedidos p
       ON f.cod_fornecedor = p.cod_fornecedor;

Em todos os exemplos apresentados ter�amos o mesmo resultado, e a performance da instru��o seria exatamente a mesma. S�o apenas formas diferentes de se escrever uma mesma instru��o.

Mas as sintaxes para diferentes possibilidades de joins n�o terminam aqui. Temos ainda o full outer join. � importante salientar que este n�o � suportado por alguns fabricantes de SGBDs.

O sentido do full outer join para n�s seria:

Queremos todos os fornecedores com seus pedidos correspondentes, se existirem, mas sempre todos os fornecedores. Esse foi o nosso exemplo inicial do left outer join;
Queremos tamb�m todos os pedidos com seus fornecedores correspondentes, se existirem, mas sempre todos os pedidos. Esse foi o nosso exemplo do right outer join.

No full outer join n�s queremos as duas condi��es simultaneamente. E a nossa instru��o seria escrita conforme a Listagem 13.


      SELECT f.nome, SUM(p.valor_total)
      FROM fornecedores f FULL OUTER JOIN pedidos p
           ON f.cod_fornecedor = p.cod_fornecedor
      GROUP BY f.nome;

Listagem 13. Exemplo utilizando full outer join

O resultado dessa instru��o est� representado na Listagem 14.


      +-------------------------------------------+-------------------------+
      | nome                                        | SUM(p.valor_total)   |
      +--------------------------------------------+------------------------+
      | ABC Materiais Eletricos                     |               NULL   |
      | Hidra Materiais Hidraulicos                 |              65.00   |
      | HidraX Materiais El�tricos e Hidraulicos    |               NULL   |
      | XYZ Materiais de Escritorio                 |             150.00   |
      +---------------------------------------------+-----------------------+

Listagem 14. Resultado de um full outer join

Mas e se o full outer join n�o for implementado pelo SGBD que voc� usa? A solu��o � fazermos as duas queries independentes, uma para cada um dos joins definidos de forma separada anteriormente e depois utilizar a nossa teoria de conjuntos para juntar o resultado de ambas.

Para isso, vamos apresentar como fazer a uni�o dos dois conjuntos de dados do exemplo anterior do full outer join. Vamos introduzir o conceito da uni�o de queries.

O operador UNION

Nosso conceito j� est� apresentado no exemplo do full outer join. Precisamos unir o resultado de duas queries, ou dois conjuntos de dados. A uni�o desses conjuntos de dados � realizada pelo operador union. Ele une o resultado de duas instru��es SELECT.

Mas, para que isso aconte�a, temos que ter um �nico princ�pio b�sico: o resultado de ambas as queries t�m que ter as mesmas colunas, na mesma sequ�ncia, e do mesmo tipo.

O SGBD n�o tem como saber se semanticamente os dados s�o os mesmos, por isso ele avalia apenas se o n�mero de colunas � igual e se o tipo das colunas correspondentes em ambas as queries � igual ou equivalente.

Dessa forma, poder�amos simular o full outer join utilizando o operador union conforme a Listagem 15.


    SELECT f.nome, SUM(p.valor_total)
    FROM fornecedores f LEFT OUTER JOIN pedidos p
      ON f.cod_fornecedor = p.cod_fornecedor
    GROUP BY f.nome
    UNION
    SELECT f.nome, SUM(p.valor_total)
    FROM fornecedores f RIGHT OUTER JOIN pedidos p
      ON f.cod_fornecedor = p.cod_fornecedor
    GROUP BY f.nome;

Listagem 15. Exemplo utilizando union

O resultado da execu��o deste comando ser� exatamente o mesmo resultado do full outer join apresentado na Listagem 14.

O operador union possui ainda a op��o all. O operador union, quando escrito union all, simplesmente junta os dois resultados das duas queries para fornecer para voc� um resultado �nico, de um �nico SELECT, por�m sem nenhuma an�lise sobre os dados unidos.

Existem casos onde o resultado da primeira e da segunda queries podem apresentar linhas com os mesmos valores em todas as colunas, isto �, linhas duplicadas. O operador union puro, sem a op��o all, elimina essas duplicidades para voc�.

� como na teoria dos conjuntos. Se tiv�ssemos dois conjuntos de frutas:

Frutas c�tricas, com: laranja, lim�o e maracuj�;
Frutas verdes, com: pera, uva verde e lim�o;

O resultado do union all seria: laranja, lim�o, maracuj�, pera, uva verde e lim�o. Note que o lim�o apareceu duas vezes. Pode ser que voc� queira esse tipo de resultado, para quantificar, por exemplo, quantas vezes uma fruta aparece nos seus conjuntos.

Mas pode ser que n�o, que voc� queira o conjunto final sem essas duplicidades. A�, nesse caso, o resultado do union puro seria o ideal para voc�, porque traria como resposta a lista de frutas sem repeti��o: laranja, lim�o, maracuj�, pera e uva verde.

A diferen�a dos resultados voc� j� entendeu. O que � importante dizer agora � que, para retirar as duplicidades dos dois conjuntos, o operador union puro precisar� trabalhar mais, e gastar� mais tempo e processamento para realizar seu trabalho. Portanto, antes de utiliz�-lo, tenha certeza de que � esse o resultado que voc� quer.

O exemplo apresentado ilustrou como o operador de queries union funciona unindo o resultado de duas queries. Mas e se quis�ssemos que o resultado final ainda fosse classificado alfabeticamente pelo nome do fornecedor?

Se coloc�ssemos a cl�usula ORDER BY dentro de cada uma das queries, ter�amos cada uma classificada, mas n�o ter�amos o resultado final classificado. Na realidade, os SGBDs nem permitem que voc� coloque cl�usulas ORDER BY em queries que ser�o ainda unidas.

A solu��o nesse caso � colocar o ORDER BY no fim da �ltima query. Assim, nosso resultado ficaria conforme a Listagem 16.


    SELECT f.nome, SUM(p.valor_total)
    FROM fornecedores f LEFT OUTER JOIN pedidos p
      ON f.cod_fornecedor = p.cod_fornecedor
    GROUP BY f.nome
    UNION
    SELECT f.nome, SUM(p.valor_total)
    FROM fornecedores f RIGHT OUTER JOIN pedidos p
      ON f.cod_fornecedor = p.cod_fornecedor
    GROUP BY f.nome
    ORDER BY f.nome;

Listagem 16. Exemplo utilizando ORDER BY

Simples, r�pido e funcional. Teremos o resultado final da uni�o classificado pelo nome do fornecedor.

O operador INTERSECT

E vamos caminhando na teoria dos conjuntos. Vamos apresentar agora o operador de interse��o. A interse��o de dois conjuntos � o conjunto do que existir de comum, coincidente ou igual, entre os dois primeiros.

Utilizando o exemplo de conjuntos apresentado, para os conjuntos de frutas c�tricas e frutas verdes, o resultado da sua interse��o seria apenas a fruta lim�o, que aparece em ambos os conjuntos iniciais.

Vamos ent�o concretizar nosso conhecimento em interse��o de queries apresentando duas queries de exemplo:

A lista dos fornecedores dos quais j� compramos mais de R$50 em pedidos, e;
A lista dos fornecedores de quem n�o compramos h� mais de um ano;

O resultado que vamos querer da sua interse��o ser�o os resultados de ambas, portanto ser�o os fornecedores de quem compramos mais de R$50 em pedidos e, ao mesmo tempo, n�o compramos dele h� mais de um ano.

Vamos por partes. Para termos o resultado da primeira consulta precisar�amos executar o comando da Listagem 17.


      SELECT f.nome
      FROM fornecedores f, pedidos p
      WHERE f.cod_fornecedor = p.cod_fornecedor
      GROUP BY f.nome
      HAVING SUM(p.valor_total)>50;

Listagem 17. Exemplo de consulta de lista dos fornecedores com o total de pedidos superior a R$50

Podemos ver seu resultado na Listagem 18. Note que fizemos um join de fornecedores e pedidos (f.cod_fornecedor = p.cod_fornecedor) e agrupamos pelo nome do fornecedor (GROUP BY f.nome).

Note que n�o apresentamos a soma no resultado da query. S� queremos a lista dos fornecedores com esta condi��o. Temos tamb�m que filtrar os fornecedores cujo total de pedidos seja superior ao valor estabelecido.

Se par�ssemos antes de filtrar, n�o ter�amos s� os dos que compramos mais de R$50, ter�amos todos. Portanto, precisamos acrescentar a cl�usula HAVING para filtrar o resultado da agrega��o.


      +----------------------------------+
      | nome                             |
      +----------------------------------+
      | Hidra Materiais Hidraulicos      |
      | XYZ Materiais de Escritorio      |
      +----------------------------------+

Listagem 18. Lista dos fornecedores com o total de pedidos superior a R$50

Para a segunda consulta precisar�amos da consulta apresentada na Listagem 19.


    SELECT f.nome
    FROM fornecedores f, pedidos p
    WHERE f.cod_fornecedor = p.cod_fornecedor AND
      p.data_pedido < current_date - interval 1 year;

Listagem 19. Exemplo de consulta de lista dos fornecedores sem pedidos a mais de um ano

O resultado desta query est� na Listagem 20. Note que fizemos um join simples entre Fornecedores e Pedidos, semelhante a query anterior e que filtramos os pedidos com a data de pedido anterior a um ano em rela��o � data atual (p.data_pedido < current_date - interval 1 year). Esta sintaxe � do SGBD MySQL.


      +----------------------------------+
      | nome                             |
      +----------------------------------+
      | Hidra Materiais Hidraulicos      |
      +----------------------------------+

Listagem 20. Lista dos fornecedores sem pedidos h� mais de um ano

Agora o que precisamos fazer � a interse��o das duas instru��es, conforme a Listagem 21.


    SELECT f.nome
    FROM fornecedores f, pedidos p
    WHERE f.cod_fornecedor = p.cod_fornecedor
    GROUP BY f.nome
    HAVING SUM(p.valor_total)>50
    INTERSECT
    SELECT f.nome
    FROM fornecedores f, pedidos p
    WHERE f.cod_fornecedor = p.cod_fornecedor AND
      p.data_pedido < current_date - interval 1 year;

Listagem 21. Exemplo de intersec��o de duas queries

O resultado est� apresentado na Listagem 22, e como podemos observar, apenas o fornecedor que est� presente no resultado das duas consultas � o resultado da interse��o.

Porque n�o fizemos uma �nica query para obter o resultado esperado das duas condi��es? � poss�vel se obter o mesmo resultado de outras formas. Utilizamos o exemplo apenas para demonstrar o uso do operador INTERSECT. Tudo que vai nos guiar em utilizar uma ou outra forma de se montar uma instru��o SELECT �: clareza no detalhamento da instru��o, para que ela seja leg�vel e compreens�vel por quem mais precisar l�-la, e performance. N�o adianta escrevermos uma instru��o leg�vel, mas que demora longos minutos para executar.


      +---------------------------------+
      | nome                            |
      +---------------------------------+
      | Hidra Materiais Hidraulicos     |
      +---------------------------------+

Listagem 22. Resultado do INTERSECT de duas queries

O operador MINUS

J� que estamos associando a teoria de conjuntos � constru��o de consultas de acesso �s bases de dados, vamos mostrar o �ltimo operador de queries do nosso artigo. Ele opera a subtra��o de queries, ou subtra��o de conjuntos.

Tomaremos como base exatamente as mesmas duas queries do exemplo da interse��o de consultas. Mas dessa vez queremos como resultado apenas os fornecedores de quem j� compramos mais de R$50 em Pedidos, e que est�o ativos, isto �, de quem fizemos compras mais recentes do que um ano.

Ou, para utilizar a mesma query e atender ao nosso exemplo de subtra��o de consultas, que este n�o esteja na lista dos fornecedores de quem n�o compramos a mais de um ano.

Como as queries dos exemplos um e dois j� foram apresentadas e detalhadas, o que precisamos agora � somente a intera��o entre elas de forma que o resultado da segunda seja exclu�do, subtra�do, do resultado da primeira. Observe a Listagem 23.


      SELECT f.nome
      FROM fornecedores f, pedidos p
      WHERE f.cod_fornecedor = p.cod_fornecedor
      GROUP BY f.nome
      HAVING SUM(p.valor_total)>50
      MINUS
      SELECT f.nome
      FROM fornecedores f, pedidos p
      WHERE f.cod_fornecedor = p.cod_fornecedor AND
            p.data_pedido < current_date - interval 1 year;

Listagem 23. Exemplo utilizando minus

Apresentamos o resultado na Listagem 24, onde podemos ver que est�o exatamente os fornecedores resultantes da primeira consulta, exclu�dos os existentes na segunda consulta.


      +-----------------------------+
      | nome                        |
      +-----------------------------+
      | XYZ Materiais de Escritorio |
      +-----------------------------+

Listagem 24. Resultado do MINUS de duas queries

� importante salientar que alguns SGBDs tamb�m n�o implementam o operador MINUS, mas, novamente, como existem in�meras maneiras de se escrever uma query, e estamos utilizando o SGBD MySQL nestes exemplos, vou apresentar uma forma de contornar esta situa��o.

Vamos apresentar um outro operador e uma outra forma de se escrever duas queries, uma dentro da outra. Vamos apresentar rapidamente o conceito de subqueries com o exemplo da Listagem 25 para suprir a falta do MINUS no MySQL.


    SELECT f.nome
    FROM fornecedores f, pedidos p
    WHERE f.cod_fornecedor = p.cod_fornecedor AND
      f.nome NOT IN
        (SELECT f.nome
         FROM fornecedores f, pedidos p
         WHERE f.cod_fornecedor = p.cod_fornecedor AND
           p.data_pedido < current_date - interval 1 year
        )
    GROUP BY f.nome
    HAVING SUM(p.valor_total)>50;

Listagem 25. Exemplo suprindo a falta do operador minus

Note que uma query est� explicitamente dentro da outra. A interpreta��o aqui seria: queremos a lista dos fornecedores dos quais j� compramos mais de R$50 em Pedidos, por�m, este resultado n�o pode conter os nomes dos fornecedores de quem n�o compramos a mais de um ano.

O operador NOT IN faz exatamente isso, exclui os fornecedores que est�o no conjunto retornado pela query seguinte. Observe tamb�m que a query dos fornecedores de quem n�o compramos a mais de um ano est� entre par�ntesis.

O objetivo dos par�ntesis � separar esta subquery da query mais externa, para que o SGBD n�o misture as cl�usulas da primeira query com as cl�usulas da segunda. E desta forma, resolvemos a aus�ncia do operador MINUS. O resultado de ambos os exemplos � exatamente o mesmo.

Auto Join

� importante apresentar tamb�m um conceito de join que, embora n�o seja muito popular, ocorre de maneira mais comum do que possamos imaginar. O �auto-join�, ou o join de uma tabela com ela mesma.

Quando vemos este exemplo de join pela primeira vez, achamos que isso seria apenas uma teoria, n�o faria sentido na vida real. Que seria uma das coisas que provavelmente n�s nunca utilizar�amos profissionalmente e que estavam nos ensinando s� para que n�s soub�ssemos que existia. Vamos apresentar um exemplo, diferente do modelo de dados apresentado, e que se utiliza do autorelacionamento para sua implementa��o.

Imagine que tiv�ssemos uma tabela de funcion�rios de uma empresa. Nesta tabela tem que estar cadastrados todos os funcion�rios dessa empresa, incluindo a coordena��o, ger�ncia, diretoria, etc.

E queremos representar nesse modelo de dados quem � o chefe de quem. Em outras palavras, queremos conseguir representar quem � o coordenador de um ou um grupo de funcion�rios, quem � o gerente desse coordenador, quem � o diretor desse gerente, etc. E estamos assumindo que cada funcion�rio possui apenas um chefe.

Esta implementa��o pode ser feita de v�rias maneiras, mas a maneira que escolhemos foi uma das mais simples: dizer com linha de cadastro do funcion�rio qual � o chefe dele.

Para representar isso no modelo de dados, precisar�amos apenas incluir uma coluna a mais nessa tabela, representando o c�digo do funcion�rio que � o chefe desse funcion�rio.

Apresentaremos as colunas dessa tabela para o entendimento ficar mais f�cil conforme a Figura 2.

**Figura 2**. Representa��o da tabela Funcion�rios

Representamos apenas algumas colunas como exemplo da tabela de funcion�rios. Observe que existe uma coluna chamada matricula_chefe, que � onde ser� indicado qual � o chefe daquele funcion�rio. O funcion�rio chefe ter� uma linha nesta mesma tabela para defini-lo.

Neste caso, como temos uma coluna da tabela que faz refer�ncia a uma outra linha da mesma tabela, dizemos que este � um auto relacionamento. Isto �, a tabela se relaciona com ela mesma e, no Modelo de Entidades e Relacionamentos, este auto relacionamento aparece como uma seta apontando para a pr�pria tabela.

Vamos colocar alguns dados nessa tabela para que nosso exemplo fique mais concreto. Na Listagem 26 voc� poder� encontrar estes dados.


      +-----------+-----------+---------+-----------------+
      | matricula | nome      | cargo    | matricula_chefe|
      +-----------+-----------+---------+-----------------+
      |         1 | Marcus    | Gerente  | 2              |
      |         2 | Marcelo   | Diretor  | NULL           |
      |         3 | Fernando  | DBA      | 1              |
      |         4 | Leticia   | DBA      | 1              |
      +-----------+----------+---------+-----------------+

Listagem 26. Dados de exemplo para um auto join

Agora, voltando ao auto join, como far�amos para listar o nome dos funcion�rios, seus respectivos cargos e o nome do chefe desse funcion�rio com o cargo do chefe? A solu��o para nossa pergunta est� na instru��o da Listagem 27 e seu resultado na Listagem 28.


    SELECT f.nome, f.cargo,
      chefe.nome, chefe.cargo
    FROM funcionarios f, funcionarios chefe
    WHERE f.matricula_chefe = chefe.matricula;

Listagem 27. Exemplo auto join


      +----------+---------+---------+----------+
      | nome     | cargo   | nome    | cargo    |
      +----------+---------+---------+----------+
      | Fernando | DBA     | Marcus  | Gerente  |
      | Leticia  | DBA     | Marcus  | Gerente  |
      | Marcus   | Gerente | Marcelo | Diretor  |
      +----------+---------+---------+---------+

Listagem 28. Resultado do auto join

Note que a tabela Funcion�rios aparece duas vezes no mesmo comando SELECT. Uma vez fazendo o papel da tabela de funcion�rios que queremos listar e a segunda vez, fazendo o papel da tabela dos chefes dos funcion�rios.

Colocamos um alias bem sugestivo na segunda representa��o da tabela funcion�rios para ficar claro que, para a segunda estamos falando dos chefes, e n�o dos funcion�rios (�funcionarios chefe�).

Perceba tamb�m que, da mesma forma que fizemos em todos os exemplos desse artigo, temos que representar como estas duas tabelas se relacionam.

Para isso, tivemos que dizer que a tabela de funcion�rios se relaciona com a tabela de chefes dos funcion�rios atrav�s do cod_funcionario_chefe dessa forma �f.cod_funcionario_chefe = chefe.cod_funcionario�. � como se tiv�ssemos realmente duas tabelas.

No resultado do exemplo do join, um inner join, observe que temos apenas tr�s funcion�rios listados, e n�o quatro como � a lista original dos funcion�rios. Observe que o funcion�rio que tem cargo de diretor n�o aparece no resultado com o nome do seu chefe ao lado.

Note que nos dados originais o diretor apresenta um NULL no lugar da matr�cula do chefe dele, isto �, ele n�o tem chefe, ou o chefe dele n�o est� definido.

Para o exemplo, onde quer�amos todos os funcion�rios com seus chefes ao lado, o resultado pode estar correto. Mas e se quis�ssemos todos os funcion�rios com ou sem chefes? A solu��o seria um outer join, onde incluir�amos todos os funcion�rios e os seus chefes seriam opcionais.

Cross Join

Este � o �ltimo conceito de join que vamos apresentar nesse artigo. Vamos mostrar este conceito aqui apenas para que voc� saiba que ele existe. Nunca vimos uma utilidade pr�tica para ele e encontr�-lo numa query � motivo para pensarmos que estamos � frente de um erro. Voc� vai entender o porqu�.

Na sua nota��o impl�cita, o cross join das tabelas de fornecedores e pedidos seria assim:


      SELECT fornecedores.nome, materiais.nome
      FROM fornecedores, materiais;

Voc� sentiu falta de alguma coisa? Este foi o nosso primeiro exemplo, onde dissemos que faltava a condi��o de join e que neste caso, ter�amos como retorno cada linha da tabela fornecedores listados ao lado de todas as linhas da tabela de materiais, isto �, como se multiplic�ssemos as linhas das duas tabelas. E conclu�mos que este join n�o faria sentido dessa forma. Mas esta � a defini��o do cross join!

Tamb�m podemos chamar este tipo de join de produto cartesiano entre as tabelas participantes. De novo a teoria de conjuntos.

Em alguns SGBDs ele � considerado como um erro de constru��o da instru��o SELECT. Normalmente, sua execu��o n�o � impedida, mas em uma avalia��o do plano de execu��o dessa query, isto �, o plano de como os dados ser�o recuperados para serem apresentados para voc�, certamente ter�amos uma sinaliza��o de que o produto cartesiano existe para chamar sua aten��o para este poss�vel erro na constru��o do join.

Se existe uma nota��o impl�cita, existe tamb�m uma nota��o expl�cita. Que seria assim:


      SELECT fornecedores.nome, materiais.nome
      FROM fornecedores CROSS JOIN materiais;

Onde fica explicitamente claro que queremos o produto cartesiano das duas tabelas. Mais uma vez, nem todos os SGBDs implementam este tipo de join.

Certamente, joins s�o muito utilizados no dia a dia profissional de desenvolvedores de sistemas, e voc� certamente j� construiu ou construir� v�rios. Tenha em mente tr�s conceitos que destacamos ao longo desse artigo:

Atingir o objetivo proposto;
Legibilidade;
Performance

Um join deve ser escrito de forma a atender o resultado que voc� espera, que voc� consiga identific�-lo, l�-lo, de maneira direta e objetiva e ele deve executar de maneira eficiente. Esperamos ter dado base e argumentos suficientes para que voc� construa joins corretos e eficientes.