Converter pdf para texto |
PDF Text OCR Xtractor é perfeito para extrair texto editável de documentos PDF e imagem de formatos populares, como PNG, JPG, BMP, GIF, TIFF, e WebP. PDF Text OCR Xtractor vem com ferramentas especiais para ajudar a extrair texto, mesmo de documentos difíceis de ler. |
PDF Text OCR Xtractor utiliza o mecanismo de OCR Tesseract. Tesseract é a tecnologia de OCR mais avançada disponível. A HP desenvolveu a tecnologia Tesseract OCR em 1994 e logo a lançou sob a Licença Apache para desenvolvimento de código aberto. Em 2006, o Google assumiu o projeto e patrocinou desenvolvedores para trabalhar nela. O Tesseract se tornou o mecanismo de OCR mais potente disponível. Tesseract usa Deep Learning para extrair textos de imagens (BMP, PNG, JPEG, TIFF) e arquivos PDF. |
PDF Text OCR Xtractor executa uma manobra brilhante para otimizar a precisao dos resultados de OCR. O programa dimensiona o documento original em até 2.000 vezes seu tamanho original para o mecanismo de OCR ver melhor o texto. O programa também traz ferramentas para documentos difíceis de ler, como aumentar dos níveis de contraste e removeçao de cores. |
PDF Text OCR Xtractor oferece suporte a mais de 21 idiomas, incluindo inglês, alemao, francês, italiano, espanhol, português, russo, japonês, chinês e todos os idiomas economicamente relevantes. Além disso, o PDF Text OCR Xtractor permite que você faça reconhecimento de OCR em lote e salve automaticamente um PDF inteiro ou vários PDFs em um arquivo de texto com um único clique. Você baixa e instala novos pacotes de idiomas quando precisa deles. Os pacotes de idiomas sao gratuitos. |
Principais características: |
PDF Text OCR Xtractor é perfeito para converter documentos PDF e imagens em texto editável. PDF Text OCR Xtractor provê excelentes resultados de reconhecimento de caracteres, independentemente do idioma. |