From 7f3148b2392002b69715cf7f26df7075f0a86cc9 Mon Sep 17 00:00:00 2001 From: hiroi-sora <2230247019@qq.com> Date: Tue, 26 Sep 2023 15:31:55 +0800 Subject: [PATCH] Update v1.3.6 --- README.md | 71 ++++++++++++++++++++----------------------------------- main.py | 10 ++++---- 2 files changed, 31 insertions(+), 50 deletions(-) diff --git a/README.md b/README.md index 5cf103f9..c4db369f 100644 --- a/README.md +++ b/README.md @@ -73,13 +73,15 @@ ## 下载 -#### Win7/8 用户 及 凌动、赛扬、奔腾处理器用户: +#### v2.0.0 -兼容`低版本Windows`和`无AVX指令集的CPU`的新识别引擎正在测试阶段,[详情见这儿](https://github.com/hiroi-sora/Umi-OCR/tree/dev/rapid/1.3.4) 。 +全新重构的v2预览版本已开放测试,[欢迎体验](https://github.com/hiroi-sora/Umi-OCR_v2)。 -#### Win10/11 用户: +#### v1.3.6 -Github下载:[Release v1.3.5](https://github.com/hiroi-sora/Umi-OCR/releases/tag/v1.3.5) +使用v1稳定版本: + +Github下载:[Release v1.3.6](https://github.com/hiroi-sora/Umi-OCR/releases/tag/v1.3.6) 蓝奏云下载:[https://hiroi-sora.lanzoul.com/s/umi-ocr](https://hiroi-sora.lanzoul.com/s/umi-ocr) @@ -147,47 +149,16 @@ Github下载:[Release v1.3.5](https://github.com/hiroi-sora/Umi-OCR/releases/t -## 文本块后处理(排版优化) - -OCR识别出的文本是按“块”划分的,通常一行文字分为一块,有时还会将一行误划分为多块,这给阅读带来了不便。**文本块后处理**就是对文本块进行再加工的过程,合并同一行或同一段落内的文字,按正确的顺序排序。 - -#### 下图表示不同排版应该选用何种处理方案: - -![](https://tupian.li/images/2022/09/29/-10-.png) - -#### 所有排版方案一览: - -
-展开
- -##### 横排-优化单行 - -将误划分为多块的同一行文字合并到一行。 - -##### 横排-合并多行-左对齐 - -将多个左对齐的行视为同一段落,合并文字。左侧未对齐或行距过大的行视为下一段落。 +## 文本块后处理(合并段落) -##### 横排-合并多行-自然段 +OCR识别出的文本是按“块”划分的,通常一行文字分为一块,有时还会将一行误划分为多块,这给阅读带来了不便。您可以在Umi-OCR设置页的**合并段落**中选择恰当的方案,合并同一行或同一段落内的文字,按正确的顺序排序。 -将多个左对齐的行视为同一段落,且第一行的开头允许多空出两个全角空格的宽度。 +#### 排版方案: -##### 横排-合并多行-模糊匹配 - -只要垂直投影有重叠,行高一致,距离较近的文本块,视为同一段落。 - -##### 竖排-从左到右-单行 / 竖排-从右至左-单行 - -优化竖排识别,合并同一行文字,按从左到右或从右到左的顺序输出每一行。 -注意,必须搭配支持竖排识别的模型库(识别语言)一起使用。 - -#### 可视化预览: - -可以在忽略区域编辑器内预览文本块后处理的效果。编辑器中以虚线框标出识别到、经过后处理的文字块。 - -这里仅仅是借用了编辑器来展示后处理的效果,实际运行任务时 **忽略区域机制 早于 后处理机制** 执行,不受后处理的影响。 - -
+- **单行**:合并同一行的文字,适合绝大部分情景。 +- **多行-自然段**:智能识别、合并属于同一段落的文字,适合绝大部分情景。 +- **多行-代码段**:尽可能还原原始排版的缩进与空格。适合识别代码片段,或需要保留空格的场景。 +- **竖排**:适合竖排排版。需要与同样支持竖排识别的模型库配合使用。 ## 忽略区域功能 @@ -351,7 +322,12 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块 `v1.3.5` 起,支持快捷识图完成并将结果写入剪贴板后,发送一组指定按键,触发翻译软件进行翻译。当然也可以用于触发你的AHK脚本等,实现更多奇奇怪怪的功能。 -这是一个隐藏高级功能,请先勾选设置页底部的`高级选项`,重启软件。设置页的`快捷识图`板块会多出一个项目:`自动复制后发送按键` 。可以录制一组快捷键并修改重复次数(支持单击、双击等)。当截图OCR完成后,会发送该按键组合。注意,必须同时勾选`自动复制结果`才能让该功能生效。 +`v1.3.6` 起,截图联动是一个单独的功能,由独立快捷键触发,与常规的截图OCR互不影响。 + +这是一个隐藏高级功能,请先勾选设置页底部的`高级选项`,重启软件。设置页的`快捷识图`板块会多出两组条目: + +- **截图联动 快捷键**:您可设置一组快捷键,来触发该功能。 +- **联动发送按键**:触发识图,并将识别结果写入剪贴板后,可以发送一组指定按键。**次**表示重复发送按键的次数。 经过测试,Umi-OCR可以顺利地与 [CopyTranslator](https://github.com/CopyTranslator/CopyTranslator) 及 [沙拉查词](https://github.com/crimx/ext-saladict) 联动触发翻译,以下是配置方法。 @@ -361,7 +337,7 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块 2. 如果不介意CopyTranslator监听剪贴板(每次剪贴板变动都尝试翻译),那么勾选Umi-OCR的`自动复制结果` 和CopyTranslator的`监听剪贴板`即可。 ![](https://tupian.li/images/2023/06/20/64915f826f16d.png) -3. 如果不一定始终开启监听剪贴板,又希望Umi-OCR在任何情况下能唤起CopyTranslator,可以这样处理:CopyTranslator在设置里勾选`双Ctrl+C翻译`;Umi-OCR的`自动复制后发送按键`录制为`ctrl+c`,`2`次。 +3. 如果不一定始终开启监听剪贴板,又希望Umi-OCR在任何情况下能唤起CopyTranslator,可以这样处理:CopyTranslator在设置里勾选`双Ctrl+C翻译`;Umi-OCR的`联动发送按键`录制为`ctrl+c`,`2`次。 ![](https://tupian.li/images/2023/06/20/6491611305570.png) ##### 联动 沙拉查词 @@ -370,7 +346,7 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块 2. 打开沙拉查词的插件设置页面,左边栏选择`基本选项`,右边栏勾选`后台保持运行`。(如果不勾选也能使用,但必须保持浏览器开启。) 3. 左边栏点击`隐私设置`,右边栏点击`设置快捷键`。 ![](https://tupian.li/images/2023/06/20/649165cae4b87.png) -4. 在弹出的新页面中,将沙拉查词的`在独立窗口中搜索剪贴板内容`设置任意一组快捷键,然后右边改为`全局`。Umi-OCR的`自动复制后发送按键`录制为相同快捷键,`1`次。 +4. 在弹出的新页面中,将沙拉查词的`在独立窗口中搜索剪贴板内容`设置任意一组快捷键,然后右边改为`全局`。Umi-OCR的`联动发送按键`录制为相同快捷键,`1`次。 ![](https://tupian.li/images/2023/06/20/649165faa434f.png) 5. 回到沙拉查词的设置页,左边栏点击`权限管理`,勾选`读取剪贴板`。 ![](https://tupian.li/images/2023/06/20/649165f7dbf18.png) @@ -597,6 +573,11 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块 点击版本号链接可前往对应备份分支。 +##### [v1.3.6](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.6) `2023.9.26` +- 新功能:更强大的段落合并方案-`单行/多行自然段/多行代码段`。支持自动判断中/英文段落,采取对应的合并规则。 +- 移除一些过时的段落合并方案。 +- 功能调整:`截图联动` 划分为独立的功能,不受常规截图OCR影响。 + ##### [v1.3.5](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.5) `2023.6.20` - 新功能:复制识别结果后,可发送指定按键,以便联动唤起翻译器等工具。 diff --git a/main.py b/main.py index 51ec6948..29d0a9b4 100644 --- a/main.py +++ b/main.py @@ -4,11 +4,11 @@ from utils.config import Umi from ui.win_main import MainWin -Umi.ver = '1.3.5' -Umi.pname = 'Umi-OCR' -Umi.name = f'{Umi.pname} v{Umi.ver}' -Umi.website = 'https://github.com/hiroi-sora/Umi-OCR' -Umi.about = '免费、开源的离线OCR软件' +Umi.ver = "1.3.6" +Umi.pname = "Umi-OCR" +Umi.name = f"{Umi.pname} v{Umi.ver}" +Umi.website = "https://github.com/hiroi-sora/Umi-OCR" +Umi.about = "免费、开源的离线OCR软件" def main():