Skip to content

Latest commit

 

History

History
24 lines (18 loc) · 2.29 KB

File metadata and controls

24 lines (18 loc) · 2.29 KB

segmentation-of-damaged-documents

Задача очистки текста от зашумленности, распознавание текста на изображении и конвертации его в текстовый формат состоит из ряда подзадач:

1. Выбор тестового изображения в любой папке на компьютере. Это происходит с помощью тестового графического интерфейса, реализованного для удобного пользования программой;
2. Процесс бинаризации изображения. Преобразования цветного изображения в черно-белое;
3. Очистка текста от зашумленности с помощью сверточной нейронной сети;
4. Очистка текста от зашумленности с помощью многослойного перцептрона;
5. Распознавание текста при помощи OCR Tesseract;
6. Конвертация текста в текстовой формат для дальнейшей обработки.

Решив последовательно задачи, приведенные выше, из входных данных в виде зашумленного изображения с текстом, получаем выходные данные в виде текста в формате пригодном для его обработки.

Необходимые библиотеки:

  1. conda install keras;
  2. conda install -c conda-forge opencv;
  3. pip install pytesseract;
  4. conda install pyQt5;
  5. Установить tesseract-ocr-setup-3.05.01;
  6. Сделать привязку в файле pytesseract.py (находится в ...\Anaconda3\Lib\site-packages) на установленный tesseract.exe в файле pytesseract.py меняем старый tesseract_cmd на это tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\';
  7. Программа запускается с помощью файла main.py (остальные файлы должны быть в этой же папке).