Encontrando e apresentando hyperlinks existentes em uma página Web

Veja nesta dica como extrair os links existentes em um arquivo HTML.

Encontrando e apresentando hyperlinks existentes em uma página Web

O código apresentado abaixo utiliza expressões regulares para encontrar e apresentar os hyperlinks existentes em uma página Web. Depois de compilar este código, você deve salvar a página web na mesma pasta que contém o arquivo. ShowLinks.class.

import java.io.*;
import java.util.regex.*;

public class ShowLinks {
public static void main(String[] arguments) {
if (arguments.length < 1) {
System.out.println("java ShowLinks [page]");
System.exit(0);
}
String page = loadPage(arguments[0]);
Pattern pattern = Pattern.compile("<a.+href=\"(.+?)\"");
Matcher matcher = pattern.matcher(page);
while (matcher.find()) {
System.out.println( matcher.group(1));
}
}

private static String loadPage(String name) {
StringBuffer output = new StringBuffer();
try {
FileReader file = new FileReader(name);
BufferedReader buff = new BufferedReader(file);
boolean eof = false;
while (!eof) {
String line = buff.readLine();
if (line == null)
eof = true;
else
output.append(line + "\n");
}
buff.close();
catch (IOException e) {
System.out.println("Erro -- " + e.toString());
}
return output.toString();
}
}

Ebook exclusivo
Dê um upgrade no início da sua jornada. Crie sua conta grátis e baixe o e-book

Artigos relacionados