Problemas com importação arquivo .pdf

08/05/2020

0

Boa tarde pessoal!! Estou com o seguinte problema :
Recebo um arquivo em pdf e preciso converter para txt, nao consegui fazer uma conversão pelo delphi e tb não obtive nenhuma luz pra tentar resolver o meu problema, então resolvi trabalhar com a memória da área de trabalho, blz, consigo jogar o texto num tmemo, porém, o mesmo fica totalmente bagunçado, vou colar um exemplo aqui... Pra constar, estou trabalhando com o Delphi 6 e banco MySql

Capitais e regiões metropolitanas: 4003-3710 Demais localidades: 0800-880-3710 SAC: 0800-772-0202 Ouvidoria: 0800-722-3710
V WIN G20 12/02/2020 1 113.030,0000 DAY TRADE 27,00 C 0,00
V WIN G20 12/02/2020 1 113.035,0000 DAY TRADE 28,00 C 0,00
V WIN G20 12/02/2020 1 113.050,0000 DAY TRADE 31,00 C 0,00
V WIN G20 12/02/2020 1 113.070,0000 DAY TRADE 35,00 C 0,00
V WIN G20 12/02/2020 1 113.095,0000 DAY TRADE 40,00 C 0,00
V WIN G20 12/02/2020 1 113.105,0000 DAY TRADE 42,00 C 0,00
V WIN G20 12/02/2020 1 113.095,0000 DAY TRADE 40,00 C 0,00
V WIN G20 12/02/2020 1 113.105,0000 DAY TRADE 42,00 C 0,00
V WIN G20 12/02/2020 1 113.105,0000 DAY TRADE 42,00 C 0,00
V WIN G20 12/02/2020 1 113.110,0000 DAY TRADE 43,00 C 0,00
V WIN G20 12/02/2020 1 113.110,0000 DAY TRADE 43,00 C 0,00
V WIN G20 12/02/2020 1 113.125,0000 DAY TRADE 46,00 C 0,00
V WIN G20 12/02/2020 1 113.175,0000 DAY TRADE 56,00 C 0,00
V WIN G20 12/02/2020 1 113.115,0000 DAY TRADE 44,00 C 0,00
V WIN G20 12/02/2020 1 113.145,0000 DAY TRADE 50,00 C 0,00
V WIN G20 12/02/2020 1 113.120,0000 DAY TRADE 45,00 C 0,00
C/V Mercadoria Vencimento Quantidade Preço/Ajuste Tipo Negócio Vlr de Operação/Ajuste D/C Taxa Operacional
NOTA DE NEGOCIAÇÃO Nr. nota
901.401
Folha
5
Data pregão
10/02/2020
Corretora
Cliente
C.N.P.J.
02.332.886/0001-04
Numero da Corretora
XXXXXXXXX
C.N.P.J/C.P.F
XXXXXXX
Codigo do Cliente
XXXXXXXXXXX
Venda disponível Compra disponível Venda Opções Compra Opções Valor dos negócios
0,00 0,00 0,00 0,00 284,00 | C
IRRF IRRF Day Trade (proj.) Taxa operacional Taxa registro BM&F Taxas BM&F (emol+f.gar)
0,00| 1,65 0,00 77,40 41,40 | D
+Outros Custos Impostos Ajuste de posição Ajuste day trade Total de custos operacionais
0,00 0,00 0,00 | 284,00 | C 118,80 | D
Outros IRRF operacional Total Conta Investimento Total Conta Normal Total liquido (#) Total líquido da nota
0,00 0,00 0,00| 163,55 | C 136,72 | C 163,55 | C
+Custos BM&F, conforme Ofício Circular BM&F 079/2007-DG
-Exercícios de opções=EXO
-OZ1=249,72 grs. / OZ2=9,990 grs. / OZ3=0,225 grs.
@ Corretora ou Pessoa Vinculada atuou na Contra Parte
* Negocios gerados automaticamente pelo sistema.
** Valores pagos conforme previsão do Contrato de Transferência de negócios realizados na BMF (Repasse /
Brokerage), celebrando entre as Corretoras Intermediadoras e a Corretora
*** Taxa referente à liquidação das operações intermediadas por Terceiros e as operações feitas integralmente
pela Corretora.
Capitais e regiões metropolitanas: 4003-3710 Demais localidades: 0800-880-3710 SAC: 0800-772-0202 Ouvidoria: 0800-722-3710


isso não fica padrão, dependendo do arquivo aumenta uma linha ou diminui, e assim vai, alguém tem uma sugestão pra me dar pois estou queimando o cérebro e não consigo pensar em mais nada... tipo, ja consigo importar um arquivo de 120 páginas, já puxo umas 110, alguns puxo tudo, mas fica nessa inconsistência, preciso de uma coisa definitiva, que não de erro..

desde já obrigado..
Lindolfo Junior

Lindolfo Junior

Responder

Posts

09/05/2020

Guilherme Wiethaus

Amigo, talvez nem consiga. Importar um pdf tentando copiar seu conteúdo para um text é mais complexo, pois as imagens e dados no texto são diferentes quando copia para a área de transferência por exemplo. Tente fazer um experimento. Marque o texto com o mouse copie e cole em em um editor de texto. Pode ou não ficar bagunçado, vai depender da construção do pdf que não é de forma linear.

talvez uma solução muito ruim, mas vai requerer muita mão de obra é transformar o pdf ou capturar isto como imagem, usar um leitor de OCR (eu já vi códigos disto feito em delphi) e converter então em formato texto. Existem componentes gratuitos que pega o pdf e transforma em imagem. Depois fica a cargo de outro componente para transformar imagem OCR para texto.

Sei que isto não ajuda muito, mas vejo que melhor do que nenhuma resposta certo?
Responder

09/05/2020

Lindolfo Junior

Amigo, talvez nem consiga. Importar um pdf tentando copiar seu conteúdo para um text é mais complexo, pois as imagens e dados no texto são diferentes quando copia para a área de transferência por exemplo. Tente fazer um experimento. Marque o texto com o mouse copie e cole em em um editor de texto. Pode ou não ficar bagunçado, vai depender da construção do pdf que não é de forma linear.

talvez uma solução muito ruim, mas vai requerer muita mão de obra é transformar o pdf ou capturar isto como imagem, usar um leitor de OCR (eu já vi códigos disto feito em delphi) e converter então em formato texto. Existem componentes gratuitos que pega o pdf e transforma em imagem. Depois fica a cargo de outro componente para transformar imagem OCR para texto.

Sei que isto não ajuda muito, mas vejo que melhor do que nenhuma resposta certo?


Oi Guilherme!!
Então eu já pensei nisso, até consegui transformar em imagem bmp, porém, não consegui fazer o OCR, eu achei alguma coisa mais pra versão mais nova do delphi e aí me complica, até tentei alterar o componente para minha versão, mas confesso que não consegui, tinha muitos componentes que não fazia nem idéia de onde tinha saido...kkkk mas eu vejo essa como a melhor saída realmente, ah, um outro problema que tive tb, foi que as vezes o pdf vem com 100 páginas, aí não consegui gerar o bmp das páginas seguintes, teria que ir página por página, entende... se conseguir fazer o OCR vai ser uma mão na roda....

abraços e obrigado pela atenção!!

Junior
Responder

01/06/2020

Lindolfo Junior

Amigo, talvez nem consiga. Importar um pdf tentando copiar seu conteúdo para um text é mais complexo, pois as imagens e dados no texto são diferentes quando copia para a área de transferência por exemplo. Tente fazer um experimento. Marque o texto com o mouse copie e cole em em um editor de texto. Pode ou não ficar bagunçado, vai depender da construção do pdf que não é de forma linear.

talvez uma solução muito ruim, mas vai requerer muita mão de obra é transformar o pdf ou capturar isto como imagem, usar um leitor de OCR (eu já vi códigos disto feito em delphi) e converter então em formato texto. Existem componentes gratuitos que pega o pdf e transforma em imagem. Depois fica a cargo de outro componente para transformar imagem OCR para texto.

Sei que isto não ajuda muito, mas vejo que melhor do que nenhuma resposta certo?


Oi Guilherme!!
Então eu já pensei nisso, até consegui transformar em imagem bmp, porém, não consegui fazer o OCR, eu achei alguma coisa mais pra versão mais nova do delphi e aí me complica, até tentei alterar o componente para minha versão, mas confesso que não consegui, tinha muitos componentes que não fazia nem idéia de onde tinha saido...kkkk mas eu vejo essa como a melhor saída realmente, ah, um outro problema que tive tb, foi que as vezes o pdf vem com 100 páginas, aí não consegui gerar o bmp das páginas seguintes, teria que ir página por página, entende... se conseguir fazer o OCR vai ser uma mão na roda....

abraços e obrigado pela atenção!!

Junior


Pessoal, continuo precisando muito fazer a conversão, o que consegui fazer esta dando muito trabalho e instabilidade, funciona, aí em determinado arquivo não funciona, por favor, alguém me ajude!!
Responder

Assista grátis a nossa aula inaugural

Assitir aula

Saiba por que programar é uma questão de
sobrevivência e como aprender sem riscos

Assistir agora

Utilizamos cookies para fornecer uma melhor experiência para nossos usuários, consulte nossa política de privacidade.

Aceitar