Selecione o texto de documentos html
Aprenda nesta dica como fazer para obter todos o conteúdo (texto) de um documento html.
final StringBuffer buf = new StringBuffer(1000); try {
HTMLDocument doc = new HTMLDocument() {
public HTMLEditorKit.ParserCallback getReader(int pos) {
return new HTMLEditorKit.ParserCallback() {
public void handleText(char[] data, int pos) {
buf.append(data);
buf.append('\n');
}
};
}
}; URL url = new URI(uriStr).toURL();
URLConnection conn = url.openConnection();
Reader rd = new InputStreamReader(conn.getInputStream());
EditorKit kit = new HTMLEditorKit();
kit.read(rd, doc, 0);
} catch (MalformedURLException e) {
} catch (URISyntaxException e) {
} catch (BadLocationException e) {
} catch (IOException e) {
} // Retorna todo o texto encontrado
return buf.toString();
}