- [python] 添加版面分析部分,支持中文、英文和表格三种版面的检测分析。详情参见:Rapid Structure部分。
- 添加Hugging Face Demo, 增加可以调节超参数的功能,详情可访问Hugging Face Demo
- 修复python部分下一些较小bugs
- merge来自AutumnSun1996的OCRWeb实现的多语言部署demo,详情参见:ocrweb_mutli-README
- 添加onnxruntime-gpu推理速度较慢于CPU的问题说明,详情参见:onnxruntime-gpu版相关说明
- 由于openvino发布了2022.2.0.dev20220829版本,该版本解决了
cls
部分模型推理的问题。至此,基于openvino的rapidocr完成了统一,全部由openvino推理引擎完成。 - 详细使用方法参见:python/README
- python/ocrweb部分 v1.1.0发布,详情参见v1.1.0
- ocrweb部分增加以API方式部署调用的功能,可以通过发送POST请求,来获得OCR识别结果。
- 详情参见:API方式调用
- 修复python版中v3 rec推理bug,并将v3 rec与v2 rec合并为同一套推理代码,更加简洁和方便
- 添加python模块下的单元测试
- 该页面添加致谢模块,感谢为这个项目作出贡献的小伙伴。
- 添加对单行文本的处理能力,对于单行文本,可自行设定阈值,不过检测模块,直接识别即可。详情参见README
- 优化python部分代码逻辑,更优雅简洁。
- python推理部分,增加参数选择使用GPU推理的配置选项,在正确安装
onnxruntime-gpu
版本前提下,可以一键使用(Fix issue#30) - 具体基于GPU的推理情况,需要等我后续整理一下,再更新出来
- 详情参见:onnxruntime-gpu版推理配置
- 重新整理python部分推理代码,将常用调节参数全部放到yaml文件中,便于调节,更加容易使用
- 详情参见:README
- 增加PaddleOCR v3 rec模型转换后的ONNX模型,直接去网盘下载替换即可。(百度网盘 | Google Drive)
- 增加文本识别模型各个版本效果对比表格,详情点击各个版本ONNX模型效果对比。v3的文本识别模型从自己构建测试集上的指标来看不如之前的好。
- 增加PaddleOCR v3 det模型转换的ONNX模型,直接去网盘下载,替换即可。(百度网盘 | Google Drive)
- 增加各个版本文本检测模型效果对比表格,详情点击各个版本ONNX模型效果对比。v3的文本检测模型从指标来看是好于之前的v2的,推荐使用。
- 增加python下的基于OpenVINO推理引擎的支持
- 给出OpenVINO和ONNXRuntime的性能对比表格
- 详情参见:python/README
- 优化python目录下的推理代码
- 添加调用不同语言模型的推理代码示例
- 详情参见:python/onnxruntime_infer/README
- 更新ocrweb部分
- 添加显示各个阶段处理时间
- 更新说明文档
- 更换文本检测模型为
ch_PP-OCRv2_det_infer.onnx
,推理更快,更准
- 添加python版本中文本检测和识别可调节的超参数,主要有
box_thresh|unclip_ratio|text_score
,详情见参数调节 - 将文本识别中字典位置以参数方式给出,便于灵活配置,详情见keys_path
- 添加使用onnxruntime-gpu版推理的代码(不过gpu版本的onnxruntime不太好用,按照官方教程配置,感觉没有调用起来GPU)
- 具体使用步骤参见: onnxruntime-gpu推理配置
- 添加基于
python
的whl文件,便于使用,详情参见release/python_sdk
- 添加PP-OCRv2新增模型onnx版本
- 使用方法推理代码不变,直接替换对应模型即可。
- 经过在自有测试集上评测:
- PP-OCRv2检测模型效果有大幅度提升,模型大小没变。
- PP-OCRv2识别模型效果无明显提升,模型大小增加了3.58M。
- 模型上传到百度网盘 提取码:30jv
-
现在正在做的
- PP-Structure 表格结构和cell坐标预测 正在整理中
-
之前做的,未完成的,欢迎提PR
- 打Dokcer镜像
- 尝试onnxruntime-gpu推理
- 完善README文档
- 增加英文、数字识别onnx模型,具体参见
python/en_number_ppocr_mobile_v2_rec
,用法同其他 - 整理一下模型转onnx
- 目前仓库下的python程序已经可以在树莓派4B上,成功运行,详细信息请进群,询问群主
- 更新整体结构图,添加树莓派的支持
- 优化ocrweb中识别结果显示,同时添加识别动图演示
- 更新
datasets
目录,添加一些常用数据库链接(搬运一下^-^) - 更新FAQ
- 添加server版文本识别模型,详情见提取码:30jv
- 整理仓库,统一模型下载路径
- 完善相关说明文档
- 新模型已经完全兼容ONNXRuntime 1.7 或更高版本。 特别感谢:@Channingss
- 新版onnxruntime比1.6.0 性能提升40%以上。