Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Last update: Oct 11, 2021

Related tags

Overview

Este programa tem o intuito de ser um modificador de arquivos PDF. Os arquivos PDFs podem ser 3: PDFs verdadeiros - em que podem ser selecionados o tipo de texto, PDFs-de-imagem - arquivos feitos de imagens e que o conteúdo é "aprisionado" e não pode ser acessado. Como terceiro tipo temos o PDFs-buscáveis: estes são os PDFs que resultam de aplicação OCR (Optical Character Recognition - Reconhecimento óptico de caracter), em que o documento é analizado e estruturado com uma nova camada de texto por detrás da camada de imagem do PDF-de-Imagem.

A criação do terceiro tipo de PDF a partir do segundo tipo é o intuito deste programa. Para isto é necessário a aplicação de alguns programas externos ao python.

Abaixo listarei o processo que utilizei para instalar estes programas externos:

Além de ter o python instalado e um ambiente virtual iniciado, é necessário utilizar o comando pip: pip install ocrmypdf. Esta biblioteca é um conjunto de pacotes que atuará sobre o PDF.

Primeiro de tudo, caso seja usuário de windows, é necessário ter um administrador de pacotes chamado Chocolotey . Após ter instalado ele, é necessário escrever os seguintes comandos:

choco install --pre tesseract
choco install ghostscript

Para mais informações sobre esse processo, caso utilizar MacOS ou Linux, acesse aqui.

Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Related tags

Overview

Owner

Daniel Soares Saldanha

A simple Security Camera created using Opencv in Python where images gets saved in realtime in your Dropbox account at every 5 seconds

Face Recognizer using Opencv Python

BNF Globalization Code (CVPR 2016)

Source code of our TPAMI'21 paper Dual Encoding for Video Retrieval by Text and CVPR'19 paper Dual Encoding for Zero-Example Video Retrieval.

Fast style transfer

Using Opencv ,based on Augmental Reality(AR) and will show the feature matching of image and then by finding its matching

3点クリックで円を指定し、極座標変換を行うサンプルプログラム

Implementation of EAST scene text detector in Keras

A Python script to capture images from multiple webcams at once and save them into your local machine

Repository relating to the CVPR21 paper TimeLens: Event-based Video Frame Interpolation

An OCR evaluation tool

Fine tuning keras-ocr python package with custom synthetic dataset from scratch

Resizing Canny Countour In Python

APS 6º Semestre - UNIP (2021)

Layout Analysis Evaluator for the ICDAR 2017 competition on Layout Analysis for Challenging Medieval Manuscripts

An Agnostic Computer Vision Framework - Pluggable to any Training Library: Fastai, Pytorch-Lightning with more to come

PSENet - Shape Robust Text Detection with Progressive Scale Expansion Network.

📷 This repository is focused on having various feature implementation of OpenCV in Python.

The code for “Oriented RepPoints for Aerail Object Detection”

Table recognition inside douments using neural networks