Problema ao extrair UTF-8 de arquivo texto

Question

Ol�,  Estou tendo o seguinte problema: lendo arquivos texto (recebidos de uma fonte externa) e percebendo caracteres estranhos no mesmo, parti

Marcelo Senaga · Answer

Poste o c�digo inteiro. E tente usar ISO_8859_1....

Fabio Zimmermann · Answer

Ol�,N�o d� para mandar o c�digo inteiro, ele � dividido em v�rias classes. Mas, posso apontar o seguinte:- Uma classe local que estende LineNumberReader (java.io - estende BufferedReader) faz a leitura dos arquivos, por meio do m�todo readLine() - isso faz parte de uma estrutura j� pronta qdo comecei aqui onde estou;- At� alguns dias atr�s, esses arquivos eram sempre recebidos em ANSI e n�o havia problema algum. Por�m, alguns arquivos, todos de uma fonte espec�fica, come�aram a vir em formato UTF-8 - e mesmo convertendo para UTF-8 na m�o nesses casos, como no c�digo do post inicial, ainda aparecem problemas com aquelas letras acentuadas. Ent�o me informei e vi algo sobre arquivos with BOM, without BOM, mas no Java n�o ocorre essa diferencia��o, � UTF-8 e pronto;- Esses arquivos a ler v�m de fontes/lugares sobre os quais n�o tenho controle direto. Eles foram informados disso, mas a resposta n�o sei qdo vir�;- Portanto, gostaria de saber como posso fazer, se esses arquivos virem com o texto dessa maneira sempre e n�o tiver jeito....

Marcelo Senaga · Answer

Veja se isso ajuda:http://stackoverflow.com/questions/9281629/read-special-characters-in-java-with-bufferedreader...