Artigo SQL Magazine 38 - Busca em redes sociais e árvores usando PL/pgSQL

Busca em redes sociais e �rvores usando PL/pgSQL

Algoritmo do Orkut, Or�culo de Bacon, N�mero de Erd�s e outras hist�rias

Rodrigo Hjort

Leitura obrigat�ria: ��rvores em PL/pgSQL: Recursividade em busca hier�rquica�, Edi��o 35 da SQL Magazine

�

Que analista de sistemas nunca se viu imaginando como funcionariam os algoritmos de busca para a classifica��o de p�ginas no Google ou como seriam obtidas as liga��es entre indiv�duos em sites de relacionamento como o Orkut? Ou melhor: como seriam feitas as modelagens de dados para essas aplica��es, se � que um SGBD relacional poderia ser usado? Os algoritmos teriam que ficar na camada de aplicativo ou de banco de dados? E quantos acad�micos j� se perguntaram �onde � que eu vou usar Teoria dos Grafos no dia-a-dia�? A an�lise a seguir tentar� responder sucintamente essas quest�es, que aparentemente n�o s�o nada triviais.

Neste artigo ser� implementado no PostgreSQL um algoritmo de busca em largura em estruturas com relacionamento recursivo. Para isso, ser�o utilizados conceitos de Teoria dos Grafos aplicados com a constru��o de fun��es nas linguagens procedurais PL/pgSQL e SQL associadas a triggers e arrays.

A Figura 1 exemplifica o tipo de relacionamento tratado na an�lise. Numa rede social (ver Nota 1), cada n� representa um indiv�duo, que por sua vez relaciona-se a um ou mais outros n�s. Neste caso, Jack Nicholson seria o mais �popular�, pois est� ligado, ou seja, relaciona-se, a outras seis pessoas. Em oposi��o, Angelina Jolie, Cameron Diaz e Kim Basinger s�o as que menos rela��es possuem: uma cada.

�

Nota 1. Defini��o de rede social.

Rede social � uma das formas de representa��o dos relacionamentos afetivos ou profissionais dos seres humanos entre si ou entre seus agrupamentos de interesses m�tuos.

Figura 1. Estrutura de uma rede social: relacionamento entre indiv�duos.

�

As instru��es SQL contidas neste artigo foram executadas utilizando a ferramenta pgAdmin III (www.pgadmin.org), que j� vem instalada com o PostgreSQL 8.1 no Windows e � facilmente instalada no Linux, FreeBSD ou Mac OS X. Al�m disso, estas instru��es funcionam em qualquer aplicativo cliente do PostgreSQL, como psql, phpPgAdmin ou PgAccess, e em qualquer plataforma. Portanto, use a ferramenta que achar mais conveniente.

Um overview das aplica��es

No in�cio de 2004 o Google, que sempre trouxe inova��es tecnol�gicas ao mundo da Internet, lan�ou uma nova onda na grande rede: os sites de relacionamento. Na realidade, j� existiam diversos produtos semelhantes, como Friendster, Tribe e LinkedIn. Por�m, o Orkut, criado por um funcion�rio do Google, um engenheiro turco chamado Orkut B�y�kkokten, foi o que ganhou a maior popularidade, especialmente entre os usu�rios brasileiros.

Quem j� visitou o servi�o Orkut deve ter notado que, ao abrir o perfil de uma pessoa ainda n�o pertencente � sua rede, o sistema traz alguns poss�veis mapeamentos para relacionar o indiv�duo selecionado ao usu�rio atual. Por exemplo, � mostrado o seguinte texto: Fulano > Beltrano > Sicrano > Voc�. Foi baseada nesta id�ia, a Teoria dos Seis Graus de Separa��o, que o Orkut foi desenvolvido. Sucintamente, esta teoria diz que todas as pessoas no mundo podem ser conectadas a qualquer outra por uma rede de no m�ximo cinco intermedi�rios. Apesar de ser provado que ela estava errada, alguns estudiosos afirmam que essa teoria pode ajudar a esclarecer diversos fen�menos, como epidemias, modas culturais, comportamento dos mercados de a��es e organiza��es que sobrevivem a mudan�as.

Um segundo exemplo de aplica��o para redes sociais � abordado no The Oracle of Bacon. O jogo, criado por um cientista da computa��o nos EUA, mostra como um ator, no caso Kevin Bacon, se relaciona com os demais artistas, sejam de filmes norte-americanos ou n�o. Alimentado periodicamente com informa��es provenientes do portal IMDB (Internet Movie Database), quando o usu�rio digita o nome de um determinado artista, o sistema faz um mapeamento entre ele e Kevin Bacon, exibindo os filmes em que tiveram participa��o juntos. Na Nota 2 � apresentado o resultado quando a atriz Audrey Tautou � especificada. Note que o sistema tamb�m informa o �N�mero de Bacon� do indiv�duo, o qual se refere ao n�mero de liga��es entre os dois artistas.

�

Nota 2. Exemplo de resultado exibido no The Oracle of Bacon

Audrey Tautou has a Bacon number of 2.

�

Audrey Tautou was in Da Vinci Code, The (2006) with Tom Hanks

Tom Hanks was in Apollo 13 (1995) with Kevin Bacon

�

Para finalizar os exemplos, podemos citar o Erd�s Number Project, um projeto que tem como objetivo estudar a colabora��o nos trabalhos de pesquisa entre os cientistas. Na realidade, os �n�meros de Erd�s� sempre fizeram parte da cultura dos matem�ticos contempor�neos. Paul Erd�s (1913-1996), um dos maiores matem�ticos do s�culo passado, nasceu na Hungria e viajou o mundo escrevendo centenas de trabalhos nas mais diversas �reas do conhecimento, e muitos deles em colabora��o com outros pesquisadores. Seu n�mero de Erd�s � 0. Os seus co-autores t�m n�mero de Erd�s 1. Outras pessoas que publicaram algum trabalho em conjunto com pessoas que possuem n�mero de Erd�s 1, mas n�o com o pr�prio Erd�s, possuem n�mero de Erd�s 2, e assim por diante. Se uma pessoa n�o possui liga��o de co-autoria com Erd�s, mesmo que de forma indireta, seu n�mero de Erd�s � dito infinito. Na Tabela 1 est�o alguns exemplos de vencedores de pr�mios Nobel e seus respectivos n�meros de Erd�s.

�

*Nome*	*Ano*	*�rea*	*# Erd�s*
Albert Einstein	1921	F�sica	2
Niels Bohr	1922	F�sica	5
Louis de Broglie	1925	F�sica	5
Erwin Schr�dinger	1933	F�sica	8
Enrico Fermi	1938	F�sica	3
Theodor Hansch	2005	F�sica	5
John Nash	1994	Economia	4
Linus Pauling	1954	Qu�mica	4
Francis Crick	1962	Medicina	5

Tabela 1. Alguns vencedores de pr�mios Nobel e seus respectivos n�meros de Erd�s.

Agora que o tema da an�lise foi proposto, mostraremos um estudo de caso na se��o a seguir.

Primeiro estudo de caso: redes sociais

Com um olhar de analista de sistemas especialista em modelagem de dados, imaginamos como poder�amos representar as informa��es no diagrama da Figura 1 em um banco de dados relacional. A entidade que representa uma pessoa seria a tabela PERFIS. Como cada pessoa pode ter uma rela��o m�tua com uma outra ou diversas outras pessoas, precisamos tamb�m de uma tabela associativa, a RELACOES. A Figura 2 ilustra o diagrama entidade-relacionamento em quest�o. Trata-se de um relacionamento recursivo do tipo rede (ver Nota 3).

�

Figura 2. Modelagem: tabela de perfis com relacionamento recursivo do tipo rede.

�

Nota 3. Resumo sobre relacionamentos recursivos

Um relacionamento recursivo acontece quando uma entidade refere-se a si mesma, e � ilustrado no caso em que uma empresa pode pertencer a outra. Neste tipo de relacionamento, a entidade (ou tabela) pai e a filho s�o a mesma. Existem duas varia��es de relacionamento recursivo:

�� Hier�rquico (recurs�o unit�ria). Neste tipo de relacionamento, uma entidade (ou tabela) pai pode ter qualquer n�mero de filhos, mas cada filho pode ter um �nico pai. Exemplo: empregado que possui um supervisor, que por sua vez ser� outro empregado e que ter� diversos subordinados. Esse exemplo de relacionamento foi abordado no artigo ��rvores em PL/pgSQL� publicado na edi��o 35 da SQL Magazine.

�� Em rede (recurs�o dupla). Neste tipo de relacionamento, uma entidade (ou tabela) pai pode ter qualquer n�mero de filhos, e um filho pode ter diversos pais. Exemplo: rede de relacionamentos, onde uma pessoa pode conhecer uma ou mais outras pessoas.

�

Em uma recurs�o do tipo rede, a tabela possui um relacionamento muitos-para-muitos consigo pr�pria. Neste caso, o SGBD necessita de uma tabela intermedi�ria, que faz com que este relacionamento desdobre-se em relacionamentos do tipo um-para-muitos. Assim, esta segunda tabela conter� duas chaves estrangeiras que apontam para a tabela original.

�

A Figura 3 apresenta o c�digo SQL para a cria��o das tabelas e respectivos relacionamentos (em PostgreSQL) conforme ilustrado na Figura 2. Vide Nota 4 para execu��o das instru��es SQL na ferramenta pgAdmin. Perceba algumas peculiaridades neste script: na tabela RELACOES, existe uma constraint do tipo CHECK que impede que uma pessoa seja relacionada a ela mesma (id1 <> id2). Al�m disso, na cria��o das chaves estrangeiras (uma para cada apontamento de RELACOES para PERFIS), foi adicionada a cl�usula ON DELETE CASCADE. Com essa regra pertencente ao padr�o ANSI, e muitas vezes esquecida, a exclus�o de um perfil faz com que todas as rela��es em que ele seja participante tamb�m sejam exclu�das automaticamente, ao inv�s de levantar qualquer tipo de exce��o durante a transa��o. Os �ndices referentes �s chaves prim�rias de ambas as tabelas s�o criados implicitamente pelo PostgreSQL.

�

Nota 4. Execu��o de SQL no pgAdmin

No pgAdmin, selecione o banco de dados desejado e acesse o menu Tools, Query Tool. Ser� aberta a janela para execu��o das instru��es. Digite-as na �rea de texto e acesse o menu Query, Execute ou simplesmente pressione F5 para execut�-las. Para mais informa��es sobre o funcionamento da ferramenta, consulte a documenta��o on-line (http://www.pgadmin.org/docs/1.4/using.html).

�

Figura 3. Cria��o das tabelas e constraints atrav�s do pgAdmin III.

�

O leitor atento j� deve ter imaginado um problema com essa modelagem no estudo de caso em quest�o: j� que a tabela RELACOES liga-se � tabela PERFIS duas vezes, quem ser� representado pelo id1 e quem ser� o id2? Exemplificando: Bruce Willis conhece (ou � amigo de) Jack Nicholson ou Jack Nicholson � quem conhece� Bruce Willis? Se considerarmos que a rela��o de amizade � m�tua, bilateral, ambas as afirmativas est�o corretas. E como resolver isso no SGBD? Simples: dupliquemos os registros! Cada conjunto (id1: X, id2: Y) ter� um correspondente (id1: Y, id2: X). Mas e agora, como controlar mais essa integridade? A resposta �: via trigger.

Com a ajuda de uma trigger, o controle dessa duplica��o de registros ser� transparente no SGBD. Criemos ent�o uma trigger que:

�� na inclus�o de um registro com o conjunto (id1: X, id2: Y), execute em seguida a inclus�o do conjunto oposto (id1: Y, id2: X);

�� na exclus�o de um registro, exclua tamb�m o registro referente ao conjunto oposto. ...

Quer ler esse conteúdo completo? Tenha acesso completo

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Rodrigo Em 2007

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Artigo SQL Magazine 38 - Busca em redes sociais e �rvores usando PL/pgSQL

Artigo da Revista SQL Magazine - Edi��o 38.