DevMedia - asp.net, Java, Delphi, SQL e web Design, tudo em um só lugar!
Bem vindo a DevMedia!
LOGIN:     SENHA:
 
 

  Este é um post disponível para assinantes MVP
Este post também está disponível para assinantes da .net Magazine DIGITAL ou para quem possui Créditos DevMedia.  Clique aqui para saber mais!


Pesquisas indexadas - .net magazine 73

Este artigo tem o intuito de desenvolver um sistema de buscas local estilo “Google”, usando um engine conhecido como Lucene.net. Vamos mostrar como indexar algumas informações e posteriormente disponibilizá-las para serem consultadas através de uma interface Web.






Pesquisas indexadas
Crie um site de buscas local em .NET, estilo “Google”

Resumo do DevMan
O objetivo deste artigo é apresentar o Lucene.net, uma ferramenta que realiza a indexação de arquivos, bem similar ao que o Google Desktop Engine e o Windows Desktop Search fazem. Serão mostrados os conceitos, as principais classes / APIs do Lucene.net e posteriormente vamos  colocar em prática seu uso desenvolvendo o exemplo prático. Além de realizar a indexação é possível realizar buscas onde os resultados podem ser ordenados, negritar o texto achado, buscar por palavras aproximadas, fazer pesquisa com a utilização de condicionais lógicas, indexar informações em arquivos que podem ficar alocados tanto no disco quanto na memória, fazer a busca em mais de um índice e muito mais.

O projeto Lucene
O Lucene começou a ser desenvolvido no final de 1997 por Doug Cutting, com a linguagem de programação Java. Em 2000 o projeto Lucene foi lançado no SourceForge, dessa forma os usuários foram apresentados a essa ferramenta de busca, que após um ano da sua divulgação conseguiu vários utilizadores, tornando-se membro do Apache Jakarta (projeto que reúne soluções e frameworks em Java de alta qualidade e colaboração). Dessa forma o projeto ganhou força na sua divulgação e consequentemente por ser Open Source, a colaboração na implementação e melhorias fluíram ao longo dos anos, aumentando a quantidade de colaboradores. Para atender a essa gama de desenvolvedores foi necessário fazer a implementação para outras linguagens de programação, como o C#, Perl, Python e C++.
A Figura 1 mostra em linhas gerais o processo de indexação de texto usado pelo Lucene.net. O motivo de mostrar esse processo é facilitar o entendimento de como é feita a indexação, a procura e ao final, a exibição do resultado para o usuário. Perceba que o texto pode ser extraído de um arquivo HTML, Word, PDF, uma base de dados dentre outras fontes. O mecanismo de extração desse texto fica a cargo do desenvolvedor, pois quando o texto é obtido, o mesmo é repassado ao Lucene.Net para sofrer uma análise.

 
Figura 1. Visão geral da indexação de texto
Analyzer
Antes de criar o índice, que é o local onde informações analisadas estão alojadas, esses dados passam por um processo de análise realizado pelo Analyzer do framework. Esse Analyzer, que nada mais é do que uma classe, pode tratar a informação passada a ele de diversas maneiras, aplicando tipos de análise. Vamos compreender de forma rápida cada uma delas:
"


ATENÇÃO! A exibição deste artigo foi interrompida.


  Este é um post disponível para assinantes MVP
Este post também está disponível para assinantes da .net Magazine DIGITAL ou para quem possui Créditos DevMedia.  Clique aqui para saber mais!






    1 COMENTÁRIO

[Fechar]

Este post é fechado - você precisa ter acesso ao post para incluir um comentário.



Mikaelly Barbosa De Araujo
muito bom o artigo, só faltou o mesmo exemplo na plataforma java!
[há +1 ano] - Responder

 



Publicidade
Autor
Erysson Batista Barros De Souza

Tenho experiência em ASP.NET utilizando a linguagem C#. Sou formado em Sistemas de Informação pelo o Instituto de Estudos Superiores da Amazônia – IESAM e Especialista em Tecnologia de Desenvolvimento de Softwares pelo Centro Universitário do Pará – CESUPA. Trabalho no Tribunal de Contas do Estado...


Space do autor
Estatísticas
Favorito:
Comentários:
Feedback:
Utilidade:
0   0
[Fechar]

Você precisa estar logado para dar um feedback.

Clique aqui para efetuar o login
[Fechar]


Este post está fechado. Saiba mais sobre a assinatura MVP!
web-03
DevMedia  |  Anuncie  |  Fale conosco
Hospedagem web por Porta 80 Web Hosting
2012 - Todos os Direitos Reservados a web-03