Skip to content

Commit

Permalink
update v1.3.3
Browse files Browse the repository at this point in the history
  • Loading branch information
hiroi-sora committed Mar 19, 2023
1 parent b62ff0f commit dc015d5
Show file tree
Hide file tree
Showing 2 changed files with 126 additions and 32 deletions.
156 changes: 125 additions & 31 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -56,6 +56,16 @@

![](https://tupian.li/images/2022/09/29/1.3-.png)

## 说明目录

- [简单上手](#简单上手) 截图、批量识别~
- [排版优化](#文本块后处理(排版优化)) 如何合并一个自然段内的文字?
- [忽略区域](#忽略区域功能) 如何排除截图水印处的文字?
- [命令行调用](#命令行调用) 用命令行或第三方工具来调用Umi-OCR!
- [多国语言](#添加多国语言) 添加更多PP-OCR支持的语言模型库!
- [更多小技巧](#进阶操作-&-小技巧)
- [问题排除](#问题排除) “无法启动引擎”怎么办?

## 下载

> Umi-OCR 软件本体含 **简体中文&英文** 通用识别库。
Expand Down Expand Up @@ -217,12 +227,69 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块

## 进阶操作 & 小技巧

`v1.3.0` 后大部分设置项都在软件内有提示,鼠标悬停即可查看。因此README不再提供所有设置的详细说明。
### 命令行调用

<details>
<summary>展开</summary>

`v1.3.3` 后支持通过命令行调用Umi-OCR,执行部分识图任务。

> 若软件未在运行,则命令行会启动软件并执行任务。若软件已在后台运行,则命令行会直接调用后台的软件执行任务。这样多次调用时可以节省初始化的时间。
注意命令行调用入口是程序目录的`extra`中的`umiocr.exe`,而不是软件常规入口(`Umi-OCR 文字识别.exe`)。

⚠︎ **`umiocr.exe`在程序目录的`extra`文件夹中。** ⚠︎

> 命令行语法按照谷歌gflags规则:
> `-命令``-命令=参数``-命令 参数`
#### 指令0:启动软件

若软件尚未启动,则任意指令均会启动软件主程序。

#### 指令1:显示窗口

`umiocr.exe`
`umiocr.exe -show`

无论主窗口处于什么状态(最小化、收到托盘、被别的窗口覆盖),该指令都会让主窗口弹到最上层。

#### 指令2:隐藏窗口

`umiocr.exe -hide`

将窗口收到托盘区或最小化。

`show``hide`这两个指令可以与其它指令混用,如 `umiocr.exe -clipboard -show`

#### 指令3:关闭软件

`umiocr.exe -exit`

#### 指令4:本地图片识别

`umiocr.exe -img=图片.png`

支持图片/文件夹;多个路径以逗号,分隔;含空格的路径加双引号""。如:

以下是进阶操作说明。
`umiocr.exe -img="D:/图库,E:/my img/图片.png"`

#### 指令5:剪贴板识图

`umiocr.exe -clipboard`

#### 指令6:截屏识图

`umiocr.exe -screenshot`

</details>


### 自定义计划任务

<details>
<summary>自定义计划任务</summary>
<summary>展开</summary>

- 除了默认的自动关机/待机外,您还可创建自己的计划任务,让软件在完成一次批量识别后执行自定义cmd命令。
- 在软件**关闭**的情况下,打开配置文件 `Umi-OCR_config.json` 。也可以先打开软件,点击设置页最底部的 **打开设置文件** ,然后退出软件。
Expand All @@ -233,8 +300,28 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块
```
</details>
### 内存清理
<details>
<summary>添加多国语言</summary>
<summary>展开</summary>
本功能默认关闭。
供内存占用十分敏感的用户使用,**会有偶尔阻慢任务速度的副作用。** 一般用户无需开启。
若有需要开启,请在设置页拉到底部,勾选`高级选项`,重启软件,然后:`OCR识别引擎设置` → `自动清理内存` → `将任一参数改成>0的值` 。
原理是满足任一条件(内存占用超限,或者一段时间没有执行任务)则重启引擎组件,释放当前引擎占用的所有内存。
![](https://tupian.li/images/2023/03/19/64168bf25e86c.png)
</details>
### 添加多国语言
<details>
<summary>展开</summary>
##### 方法一:下载 [Umi-OCR 多国语言识别扩展包] ,拷贝到软件目录即可。
Expand All @@ -257,8 +344,11 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块
</details>
### 添加到运行(Win+R快捷键)
<details>
<summary>添加到运行(Win+R)</summary>
<summary>展开</summary>
1. 在任何地方创建一个文件夹,名字随意,将该文件夹的路径[加入系统环境变量](https://www.bing.com/search?q=win10+%E6%B7%BB%E5%8A%A0%E7%8E%AF%E5%A2%83%E5%8F%98%E9%87%8F)。
2. 软件创建一个快捷方式,改一个简短的名字,如`umi`。
Expand All @@ -268,10 +358,29 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块
</details>
(`v1.3.1`起,软件内已支持添加到开机自启、添加桌面快捷方式、添加到开始菜单。)
## 问题排除
<details>
<summary>无法启动引擎</summary>
> 本项目离线引擎暂不支持在没有AVX指令集的CPU上运行,下图指示如何判断是否由此原因引起。
![CPUAVX.png](https://tupian.li/images/2022/11/04/63651e9eed1df.png)
> 常见的家用CPU一般都支持AVX指令集,如下:
| AVX | 支持的产品系列 | 不支持 |
| ----- | -------------------------------------------------------- | ----------------------------------------------------------- |
| Intel | 酷睿Core,至强Xeon,11代及以后的赛扬Celeron和奔腾Pentium | 凌动Atom,安腾Itanium,10代及以前的赛扬Celeron和奔腾Pentium |
| AMD | 推土机架构及之后的产品,如锐龙Ryzen、速龙Athlon、FX 等 | K10架构及之前的产品 |
> 可通过 [CPU-Z](https://www.cpuid.com/downloads/cpu-z/cpu-z_2.03-cn.zip) 软件查看自己CPU的指令集信息。
>
> 若具有AVX指令集,仍引发了初始化引擎失败的报错,请提issue。
</details>
<details>
<summary>多屏幕截图不正常</summary>
Expand All @@ -294,26 +403,6 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块
</details>
<details>
<summary>初始化引擎失败</summary>
> 本项目离线引擎暂不支持在没有AVX指令集的CPU上运行,下图指示如何判断是否由此原因引起。
![CPUAVX.png](https://tupian.li/images/2022/11/04/63651e9eed1df.png)
> 常见的家用CPU一般都支持AVX指令集,如下:
| AVX | 支持的产品系列 | 不支持 |
| ----- | -------------------------------------------------------- | ----------------------------------------------------------- |
| Intel | 酷睿Core,至强Xeon,11代及以后的赛扬Celeron和奔腾Pentium | 凌动Atom,安腾Itanium,10代及以前的赛扬Celeron和奔腾Pentium |
| AMD | 推土机架构及之后的产品,如锐龙Ryzen、速龙Athlon、FX 等 | K10架构及之前的产品 |
> 可通过 [CPU-Z](https://www.cpuid.com/downloads/cpu-z/cpu-z_2.03-cn.zip) 软件查看自己CPU的指令集信息。
>
> 若具有AVX指令集,仍引发了初始化引擎失败的报错,请提issue。
</details>
## 效率测试
<details>
Expand Down Expand Up @@ -412,13 +501,11 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块
- 增加独立的设置语言窗口,可在多处点开,便于切换语言。
- 合并段落添加`合并自然段-西文模式`,可在英文段落换行时补充空格。
- 快捷识图可选`自动清空面板`,只显示本次识别结果,且隐藏时间信息。
</details>
▼ 测试中 ([测试版](https://github.com/hiroi-sora/Umi-OCR/issues/96) 已开放下载。)
- 定时或超过限度时自动清理引擎内存占用。
- 通过命令行控制Umi-OCR。
- 弹出悬浮的识别成功与否的提示。
- 定时或超过限度时自动清理引擎内存占用。
</details>
<details>
<summary>画饼(有生之年)</summary>
Expand All @@ -441,6 +528,13 @@ OCR识别出的文本是按“块”划分的,通常一行文字分为一块
点击版本号链接可前往对应备份分支。
##### [v1.3.3](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.3) `2023.3.19`
<!-- 4.5k★ 撒花~ -->
- 新功能:命令行模式。
- 新功能:识图完成的通知悬浮窗。
- 新功能:自动清理引擎内存。
- 修复了一些BUG,优化了一些UI表现。
##### [v1.3.2](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.2) `2022.12.1`
<!-- 3k★ 撒花~ -->
- 新功能:创建开机启动项时,可选`不显示主窗口`。
Expand Down
2 changes: 1 addition & 1 deletion main.py
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@
from utils.config import Umi
from ui.win_main import MainWin

Umi.ver = '1.3.3 alpha.2'
Umi.ver = '1.3.3'
Umi.pname = 'Umi-OCR'
Umi.name = f'{Umi.pname} v{Umi.ver}'
Umi.website = 'https://github.com/hiroi-sora/Umi-OCR'
Expand Down

0 comments on commit dc015d5

Please sign in to comment.