Como converter PDF para OCR

Quando um documento em papel é digitalizado e salvo no formato PDF, o computador não sabe qual é a diferença entre a página de texto digitalizada e a fotografia. Portanto, você não pode pesquisar ou selecionar texto na página para copiar e colar. Se você deseja pesquisar ou selecionar texto, execute um reconhecimento óptico de caracteres (OCR) no documento. O Adobe Acrobat Professional fornece essa funcionalidade, mas as três versões do Adobe Acrobat não. Se você não possui o Adobe Acrobat Professional, lembre-se de que existem outros programas de software além do Acrobat Professional que executam o OCR em um documento PDF e você pode encontrá-los pesquisando na Web.

Execute o reconhecimento óptico de caracteres (OCR) em um documento PDF

Passo 1

Carregue o Adobe Acrobat Professional. A funcionalidade OCR do Acrobat Professional não está disponível no plug-in do navegador da Web, portanto, é necessário carregar o programa real.

Etapa 2

Carregue um documento PDF com texto que você não pode copiar ou colar. Esses documentos geralmente ocorrem quando um documento é digitalizado ou quando um documento é salvo no formato PDF do Adobe Acrobat. (Consulte Recursos para ver um documento de exemplo, se você quiser praticar com um.)

Etapa 3

Execute o OCR no documento. No Adobe Acrobat Professional, clique no menu “Documento”, selecione “Reconhecimento de texto OCR” e clique em “Reconhecer texto usando OCR”.

Etapa 4

Escolha as opções de OCR a serem aplicadas. Quando você clica em “Reconhecer texto usando OCR”, uma nova janela será exibida solicitando que você selecione o intervalo de páginas nas quais deseja executar o OCR. Você pode executar o OCR em todo o arquivo PDF ou restringir o reconhecimento de OCR a apenas algumas páginas. Quando você escolher quantas páginas deseja executar o OCR, clique em “Aceitar”. O Acrobat Professional agora começará a reconhecer o texto nas páginas do documento.

Etapa 5

Pesquise o texto quando o OCR terminar e copie e cole o texto como faria com um PDF obtido no Microsoft Word. No entanto, lembre-se de que a tecnologia OCR não é perfeita. O OCR pode não reconhecer certas palavras corretamente e parte do texto pode estar faltando completamente. O OCR funciona melhor com imagens perfeitamente claras de texto, algo que nem sempre é possível com documentos digitalizados.

Referências

 

Você pode estar interessado:

Deixe um comentário