Introdução ao Oracle Text � Parte 02

IV - Cria��o e Utiliza��o de �ndices Textuais

A estrutura geral do �ndice Oracle Text � um �ndice invertido, ou seja, uma lista de palavras existentes em um documento, com cada palavra tendo uma lista de documentos onde elas aparecem. � chamado de invertido porque � o inverso da forma usual de analisar um texto, que neste caso � uma lista de documentos onde cada documento cont�m uma lista de palavras.

� poss�vel criar um �ndice texto como um �ndice extens�vel para o Oracle utilizar o SQL padr�o, ou seja, o �ndice Oracle Text poderia operar como um �ndice do Oracle. Provendo assim, um nome pelo qual seria referenciado e manipulado atrav�s de express�es SQL padr�o.

A op��o em escolher um �ndice Oracle Text � influenciada por um r�pido tempo de resposta para consultas com as fun��es CONTAINS, CATSEARCH, e MATCHES do Oracle Text, que consultam os tipos de �ndices CONTEXT, CTXCAT, e CTXRULE respectivamente.

Tanto os �ndices baseados em fun��o quanto os �ndices Oracle Text permitem navega��o, podendo utiliz�-los intercalados. Assim, � poss�vel usar, primeiramente, o �ndice Oracle Text para remover todos os documentos que potencialmente coincidem com o crit�rio, e ent�o, aplicam-se posteriormente, filtros tais como as fun��es existsNode() ou extract() sobre o restante dos documentos.

Como um exemplo simples, iremos criar e popular algumas tabelas que relacionam uma publica��o com autor e editora.

 
--CRIA��O DAS TABELAS PARA OS TESTES


CREATE TABLE PUBLICACAO (

  CODIGO_PUBLIC               VARCHAR2 (4)  NOT NULL,

  CODIGO_EDITORA              VARCHAR2 (4),

  CODIGO_AUTOR               VARCHAR2 (4),

  DESCRICAO_TITULO               VARCHAR2 (300));


CREATE TABLE AUTOR (

  CODIGO_AUTOR         VARCHAR2 (4)  NOT NULL,

  NOME_AUTOR_INVERTIDO  VARCHAR2 (250));

CREATE TABLE EDITORA (

  CODIGO_EDITORA         VARCHAR2 (4)  NOT NULL,

  NOME_EDITORA         VARCHAR2 (250));
 

--POPULANDO AS TABELAS


--TABELA AUTOR

INSERT INTO AUTOR VALUES('0001','Machado, Ant�nio Cl�udio da Costa');

INSERT INTO AUTOR VALUES('0002','Houaiss, AnTOnio');

INSERT INTO AUTOR VALUES('0003','KNUTH, DONALD ERVIN');

--TABELA EDITORA

INSERT INTO EDITORA VALUES('0001','Manole');

INSERT INTO EDITORA VALUES('0002','Objetiva');

INSERT INTO EDITORA VALUES('0003','ADDISON WESLEY');

INSERT INTO EDITORA VALUES('0004','LTC');

--TABELA PUBLICACAO

INSERT INTO PUBLICACAO VALUES('0001','0001','0001','C�digo de Processo Civil Interpretado : artigo por artigo, par�grafo por par�grafo');

INSERT INTO PUBLICACAO VALUES('0002','0002','0002','Dicion�rio Houaiss da l�ngua portuguesa');

INSERT INTO PUBLICACAO VALUES('0003','0002','0002','Dicion�rio Houaiss de sin�nimos e ant�nimos');

INSERT INTO PUBLICACAO VALUES('0004','0003','0003','ART OF COMPUTER PROGRAMMING - V.3');

INSERT INTO PUBLICACAO VALUES('0005','0004','0003','MATEMATICA CONCRETA');

Neste momento apresento o primeiro problema, recuperar as publica��es. Podemos fazer isso facilmente com o seguinte bloco de comandos sql:

 
SELECT

 P.DESCRICAO_TITULO,A.NOME_AUTOR_INVERTIDO,E.NOME_EDITORA

FROM

 AUTOR A, EDITORA E, PUBLICACAO P

WHERE

 P.CODIGO_AUTOR=A.CODIGO_AUTOR

AND

P.CODIGO_EDITORA=E.CODIGO_EDITORA

Ter�amos como retorno:

Neste momento desejamos fazer uma busca, por titulo(DESCRICAO_TITULO), nome do autor(NOME_AUTOR_INVERTIDO) e nome da editora(NOME_EDITORA), com as seguintes caracter�sticas:

A busca dever� ser feita com qualquer parte do nome.
A busca deve ser �case-insensitive�.
A acentua��o ou n�o deve ser irrelevante na busca.

Para isso iniciaremos com a cria��o das prefer�ncias que ser�o utilizados na cria��o dos �ndices:

OBS: O usu�rio para tanto deve ter privil�gios em CTXPAA.

 
Begin

  Ctx_Ddl.Create_Preference ('mixed_case_lexer_pref','BASIC_LEXER');

  Ctx_Ddl.Set_Attribute ( 'mixed_case_lexer_pref', 'mixed_case', 'FALSE');

  Ctx_Ddl.Set_Attribute ( 'mixed_case_lexer_pref', 'base_letter','TRUE'); 

end;

O pr�ximo passo � a cria��o dos �ndices, neste exemplo usaremos um �ndice do tipo CONTEXT.

 
  create index MIX_TITULO_01_IDX on  PUBLICACAO(DESCRICAO_TITULO)

  indextype is ctxsys.context

  parameters ('LEXER MIXED_CASE_LEXER_PREF')  ;



create index MIX_NOM_AUTOR_01_IDX on  AUTOR(NOME_AUTOR_INVERTIDO)

  indextype is ctxsys.context

  parameters ('LEXER MIXED_CASE_LEXER_PREF')  ;


create index MIX_NOME_EDITORA_01_IDX on  EDITORA(NOME_EDITORA)

  indextype is ctxsys.context

  parameters ('LEXER MIXED_CASE_LEXER_PREF')  ;

Pronto, j� podemos utilizar os �ndices criados para pesquisa, abaixo crio um bloco de c�digo que permite a busca desejada:

 
SELECT

P.DESCRICAO_TITULO,A.NOME_AUTOR_INVERTIDO,E.NOME_EDITORA

FROM AUTOR A, EDITORA E, PUBLICACAO P

WHERE

P.CODIGO_AUTOR=A.CODIGO_AUTOR

AND

P.CODIGO_EDITORA=E.CODIGO_EDITORA

AND

(

CONTAINS( NOME_AUTOR_INVERTIDO, (:NOME_PESQ))>0

OR

CONTAINS(DESCRICAO_TITULO, (:NOME_PESQ))>0

OR

CONTAINS(NOME_EDITORA, (:NOME_PESQ))>0

)

Fazendo a busca pelo nome Ant�nio, teremos o seguinte retorno:

Como podemos constatar a busca foi �case-insensitive� e ignorou a posi��o do nome solicitado.

Notem que podemos realizar pesquisas com �OR� ou �AND� entradas como:

Antonio OR dicionario, s�o v�lidas, inclusive podemos deixar nosso c�digo mais sofisticado de modo que automaticamente o mesmo procure m�ltiplas palavras em v�rios campos:

 
SELECT

P.DESCRICAO_TITULO,A.NOME_AUTOR_INVERTIDO,E.NOME_EDITORA

FROM AUTOR A, EDITORA E, PUBLICACAO P

WHERE

P.CODIGO_AUTOR=A.CODIGO_AUTOR

AND

P.CODIGO_EDITORA=E.CODIGO_EDITORA

AND

(

CONTAINS( NOME_AUTOR_INVERTIDO,replace((TRIM(:NOME_PESQ)),' ',' OR '))>0

OR

CONTAINS(DESCRICAO_TITULO, replace((TRIM(:NOME_PESQ)),' ',' OR '))>0

OR

CONTAINS(NOME_EDITORA, replace((TRIM(:NOME_PESQ)),' ',' OR '))>0

)

Obs: Apesar do TRIM, esse c�digo necessita de uma fun��o de tratamento para o caso do usu�rio digitar dois ou mais espa�os no meio da busca, creio que � �timo treino para o leitor.

Caso necessitemos �dropar� essas prefer�ncias usamos o seguinte comando:

 
  begin

  Ctx_Ddl.Drop_Preference ('mixed_case_lexer_pref');

end;

No caso dos �ndices:

 
drop index MIX_TITULO_01_IDX;

drop index MIX_NOM_AUTOR_01_IDX;

drop index MIX_NOME_EDITORA_01_IDX;

V - Refer�ncias

Oracle Text � Reference � Release 9.2, March 2002 Part N� A98518-01

Saiba mais:

Introdu��o ao Oracle Text - Parte 01

Confira outros conte�dos:

Por Devmedia Em 2008

M�todo para iniciantes

sem base nenhuma

Mentorias individuais

quando voc� travar

+40 projetos reais

para o seu portf�lio

+5000 exerc�cios

para fixar o conte�do

Suporte IA

que te ensina

No code e automa��es

pra entregar mais r�pido

Veja os resultado dos nossos alunos

Conquistas reais de quem est� aplicando o m�todo

Seja Membro

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Introdu��o ao Oracle Text � Parte 02

Dando continuidade a introcu��o ao Oracle Text.

IV - Cria��o e Utiliza��o de �ndices Textuais

V - Refer�ncias

Confira outros conte�dos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para come�ar a atuar como programador?

Por que a programa��o se tornou a profiss�o mais promissora da atualidade?

Quais s�o os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programa��o atrav�s da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem hor�rio para as aulas?

Por que a DevMedia n�o usa videoaulas em sua did�tica?

Preciso de um computador espec�fico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais s�o os planos de assinatura dispon�veis?

Adquirindo o plano, terei acesso a todo o conte�do?

A plataforma tem planos vital�cios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

Como excluir meus dados da plataforma?