segmentation-of-damaged-documents

Задача очистки текста от зашумленности, распознавание текста на изображении и конвертации его в текстовый формат состоит из ряда подзадач:

1. Выбор тестового изображения в любой папке на компьютере. Это происходит с помощью тестового графического интерфейса, реализованного для удобного пользования программой;
2. Процесс бинаризации изображения. Преобразования цветного изображения в черно-белое;
3. Очистка текста от зашумленности с помощью сверточной нейронной сети;
4. Очистка текста от зашумленности с помощью многослойного перцептрона;
5. Распознавание текста при помощи OCR Tesseract;
6. Конвертация текста в текстовой формат для дальнейшей обработки.

Решив последовательно задачи, приведенные выше, из входных данных в виде зашумленного изображения с текстом, получаем выходные данные в виде текста в формате пригодном для его обработки.

Необходимые библиотеки:

conda install keras;
conda install -c conda-forge opencv;
pip install pytesseract;
conda install pyQt5;
Установить tesseract-ocr-setup-3.05.01;
Сделать привязку в файле pytesseract.py (находится в ...\Anaconda3\Lib\site-packages) на установленный tesseract.exe в файле pytesseract.py меняем старый tesseract_cmd на это tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\';
Программа запускается с помощью файла main.py (остальные файлы должны быть в этой же папке).

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

segmentation-of-damaged-documents

Задача очистки текста от зашумленности, распознавание текста на изображении и конвертации его в текстовый формат состоит из ряда подзадач:

Необходимые библиотеки:

Files

README.md

Latest commit

History

README.md

File metadata and controls

segmentation-of-damaged-documents

Задача очистки текста от зашумленности, распознавание текста на изображении и конвертации его в текстовый формат состоит из ряда подзадач:

Необходимые библиотеки: