Fórum Alguém conhece algum HTML PArser, gratuito? #331300

17/10/2006

0

Olá amigos, alguém conhece alguma Unit, Componente que eu possa pegar as URLs de dentro de um Site? Tentei achar alguma coisa pro Indy mas não achei... só achei bibliotecas grandes, porém pagas...

Desde já agradeço


[]s


Titanius

Titanius

Responder

Posts

17/10/2006

Massuda

Sugestão... se você conhece RegEx, acho que essa seria uma solução mais simples. Parseadores de HTML geralmente são complexos, alguns consomem muita memória. Alguns links que podem ser úteis se você optar por isso:

http://www.regexbuddy.com/delphi.html (free)
http://www.nichesoftware.co.nz/regex.html (shareware)
http://www.renatomancuso.com/ (free)


Responder

Gostei + 0

17/10/2006

Titanius

Olá massuda, minha intenção é pesquisar todas as urls de um site... pra gravar num banco de dados... tipo um web crawler...

esse negocio de RegEx, será que funciona pra isso?


[]s


Responder

Gostei + 0

17/10/2006

Massuda

esse negocio de RegEx, será que funciona pra isso?
Se você conhece RegEx (regular expressions/expressões regulares), você pode tentar fazer busca pelo padrão...
<a[\s]+[^>]*?href[\s]?=[\s\´\´]+(.*?)[\´\´]+.*?>([^<]+|.*?)?<\/a>


Não é boa idéia usar isso sem ter noção de expressões regulares.


Responder

Gostei + 0

17/10/2006

Titanius

Entendi.. onde posso buscar sobre estas tais Expressoes Regulares?


[]s


Responder

Gostei + 0

17/10/2006

Massuda

Google?

Como expressões regulares são muito usadas em Perl e PHP, deve ser relativamente fácil achar material sobre isso. A idéia não é complicada, mas o esquema de definir padrões é.


Responder

Gostei + 0

17/10/2006

Titanius

Valeu... :D


Responder

Gostei + 0

Utilizamos cookies para fornecer uma melhor experiência para nossos usuários, consulte nossa política de privacidade.

Aceitar