Selecione o texto de documentos html

Aprenda nesta dica como fazer para obter todos o conteúdo (texto) de um documento html.

Selecione o texto de documentos html

 

Aprenda nesta dica como fazer para obter todos o conteúdo (texto) de um documento html.

public static String getText(String uriStr) {
final StringBuffer buf = new StringBuffer(1000);
try {
HTMLDocument doc = new HTMLDocument() {
public HTMLEditorKit.ParserCallback getReader(int pos) {
return new HTMLEditorKit.ParserCallback() {
public void handleText(char[] data, int pos) {
buf.append(data);
buf.append('\n');
}
};
}
};
URL url = new URI(uriStr).toURL();
URLConnection conn = url.openConnection();
Reader rd = new InputStreamReader(conn.getInputStream());
EditorKit kit = new HTMLEditorKit();
kit.read(rd, doc, 0);
} catch (MalformedURLException e) {
} catch (URISyntaxException e) {
} catch (BadLocationException e) {
} catch (IOException e) {
}
// Retorna todo o texto encontrado
return buf.toString();
}
Ebook exclusivo
Dê um upgrade no início da sua jornada. Crie sua conta grátis e baixe o e-book

Artigos relacionados