Encontrando e apresentando hyperlinks existentes em uma página Web

Você precisa estar logado para dar um feedback. Clique aqui para efetuar o login
Para efetuar o download você precisa estar logado. Clique aqui para efetuar o login
Confirmar voto
0
 (0)  (0)

Veja nesta dica como extrair os links existentes em um arquivo HTML.

O código apresentado abaixo utiliza expressões regulares para encontrar e apresentar os hyperlinks existentes em uma página Web. Depois de compilar este código, você deve salvar a página web na mesma pasta que contém o arquivo. ShowLinks.class.

import java.io.*;
import java.util.regex.*;

public class ShowLinks {
    public static void main(String[] arguments) {
        if (arguments.length < 1) {
            System.out.println("java ShowLinks [page]");
            System.exit(0);
        }
        String page = loadPage(arguments[0]);
        Pattern pattern = Pattern.compile("<a.+href=\"(.+?)\"");
        Matcher matcher = pattern.matcher(page);
        while (matcher.find()) {
            System.out.println( matcher.group(1));
        }
    }

    private static String loadPage(String name) {
        StringBuffer output = new StringBuffer();
        try {
            FileReader file = new FileReader(name);
            BufferedReader buff = new BufferedReader(file);
            boolean eof = false;
            while (!eof) {
                String line = buff.readLine();
                if (line == null)
                    eof = true;
                else
                    output.append(line + "\n");
            }
            buff.close();
        catch (IOException e) {
            System.out.println("Erro -- " + e.toString());
        }
        return output.toString();
    }
}

 
Você precisa estar logado para dar um feedback. Clique aqui para efetuar o login
Receba nossas novidades
Ficou com alguma dúvida?