Tested under Python3 with Ubuntu 16.04 and Ubuntu 18.04
一款针对扫描文档的离线文本识别SDK,核心代码全部采用C++开发,并提供Python接口
由于时间有限,暂停Windows版本的维护,将专心开发Linux版本
当前版本为测试版,不适合在实际项目中使用
pip install numpy Pillow opencv-python
- 安装方法一
git clone https://github.com/myhub/tr.git cd ./tr sudo python setup.py install
- 安装方法二
pip install git+https://github.com/myhub/tr.git@master
- 测试是否安装成功
python test.py python test_angle.py
import tr # detect text lines, return list of (x, y, width, height) print(tr.detect("imgs/web.png")) # detect text lines with angle, return list of (cx, cy, width, height, angle) print(tr.detect("imgs/id_card.jpeg", tr.FLAG_ROTATED_RECT)) # recognize text line, return (text, confidence) print(tr.recognize("imgs/line.png")) # detect and recognize text lines, return list of ((x, y, width, height), text, confidence) print(tr.run("imgs/name_card.jpg")) # detect and recognize text lines with angle, return list of ((cx, cy, width, height, angle), text, confidence) print(tr.run_angle("imgs/id_card.jpeg"))
- 检测带角度的文本框
- 识别部分支持带角度的文本框
- 优化识别部分代码
- 支持表格检测
- 识别英文空格
- 支持GPU/手机端