# 分支使用说明 点击后续列表的版本号链接,可前往对应备份分支页面。 部分备份分支含有体积较大的二进制库,会让你花费长时间下载。因此,建议只下载你需要用的分支。 方法1:将所需的分支,fork到你自己的账号下,然后clone你自己仓库。 方法2:使用以下命令手动clone指定分支: ``` git clone --single-branch --branch [分支名] https://github.com/hiroi-sora/Umi-OCR.git ``` 方法3:在本仓库手动下载指定分支的zip源码包。 `[分支名]` 可以是 `main` 、`release/2.0.0` 等,详见下方列表。 `main`、`dev` 等分支,可能含有开发中的不稳定的新功能。如果用于研究学习或二次开发,建议选择 `release` 开头的分支。 # 更新日志 CHANGE LOG ### v2.1.4 `2024.8.31` 分支名:`main` - 修复:引擎原始输出项的"text"为空时,导致文本分析越界的错误。 (#625) - 新增UI语言:葡萄牙语 `Português` 。译者:[@杨鹏](https://hosted.weblate.org/user/ypf) - **PaddleOCR 插件相关**: - 修复:布尔类型选项不生效的问题。 - 修复: `繁体中文` 配置文件错误的问题。 - 优化:调整默认线程/内存限制,默认内存占用不超过系统总内存的一半。 - 优化:调整识别语言库结构,精简不必要的文件。 - **Linux 版本相关**: - 修复:[Docker 部署](https://github.com/hiroi-sora/Umi-OCR_runtime_linux/blob/main/README-docker.md) 在部分旧系统中报错 `'code': 803` 的问题。(#621) - 优化:`glibc` 依赖降级至 `2.31` ,兼容 Debian-11 、 Ubuntu-20 等发行版。 ### [v2.1.3](https://github.com/hiroi-sora/Umi-OCR/tree/release/2.1.3) `2024.7.23` 分支名:`release/2.1.3` - 新兼容 Linux 平台。 - 支持:[Docker 部署](https://github.com/hiroi-sora/Umi-OCR_runtime_linux/blob/main/README-docker.md) 。 - 新增:HTTP 文档识别接口。👉 [文档](https://github.com/hiroi-sora/Umi-OCR/blob/main/docs/http/api_doc.md#/api/doc) - 修复:文档中宽高为0的异常图片会导致任务卡住。 - 优化:排版解析的 **单栏-单行** 方案,对于间隔较大的两个相邻文本块,会添加空格作为间隔符。 ### [v2.1.2](https://github.com/hiroi-sora/Umi-OCR/tree/release/2.1.2) `2024.6.5` 分支名:`release/2.1.2` - 新增:批量任务(图片、文档)支持 **暂停任务** 。只要不退出软件,在待机/休眠后可以恢复任务。 (#469) - 新增:批量文档任务,支持保存为 **单层纯文本PDF** 。 - 新增:HTTP OCR接口 允许设置 **忽略区域** 参数。 (#525) - 新增:HTTP 二维码接口 允许设置 **图像预处理** 参数。 (#512) - 新增:命令行`--screenshot`允许指定屏幕范围,自动进行截图。 (#452) - 修复:文档内容提取和写入时的坐标旋转、比例适配问题。 - 修复:截图预览 & 记录面板中,跨区块复制文本时,尾块的复制字数不正确。 - 优化:批量文档标签页,拖入大量文件、提交大批任务时的性能和流畅度。 (#476) - UI:优化一些布局,美化一些视觉效果。 ### [v2.1.1](https://github.com/hiroi-sora/Umi-OCR/tree/release/2.1.1) `2024.3.29` 分支名:`release/2.1.1` - 新增:批量文档识别允许指定忽略区域的页数范围。 - 新增:命令行`--path`允许传入多个图片或文件夹。 - 新增:新的命令行、HTTP接口:识别/生成二维码图像。 - 新增:命令行新指令 `--output`, `--output_append`, `--clip` 。 - 新增:清空全部识别记录的快捷键。 (#420) - 新增:截图预览 删除图片显示的选项和快捷键。 (#427) - 修复:Esc取消截图的消息传递错误。 (#402) - 修复:文档`整页强制OCR`模式下,提高小尺寸页面的渲染精度。 - 修复:Windows7及低端CPU无法进行文档识别的Bug。 - 优化:开始菜单/开机自启快捷方式,默认放置于用户目录下,避免请求管理员权限。 - 优化:保存双层PDF,在没有新文本写入时的处理逻辑。 (#416) - 优化:PDF解析时,提取原有文本行的逻辑。 - 优化:双栏面板会记忆左右折叠状态。 - UI:优化一些提示,修复一些渲染问题,美化一些视觉效果。 ### [v2.1.0](https://github.com/hiroi-sora/Umi-OCR/tree/release/2.1.0) `2024.2.29` 分支名:`release/2.1.0` - 新增:批量文档识别功能。支持 `pdf, epub, mobi` 等格式。 - 新增:允许隐藏托盘图标。 (#338) - 新增:重复上一次截图区域的快捷键。 (#357) - 新增:用本地图片浏览器打开图片的快捷按钮。 (#335) - 更新:更强大的排版解析器。 - 修复:避免系统环境变量`QMLSCENE_DEVICE`的影响。 (#270) ### [v2.0.2](https://github.com/hiroi-sora/Umi-OCR/tree/release/2.0.2) `2024.1.15` 分支名:`release/2.0.2` - 更新:全局设置可调节 图片文字叠加层`开启/关闭`默认显示状态。 (#264) - 优化:输出为`txt 单独文件`时,将应用`指定路径`参数。 (#269) - 优化:`段落合并-多行-代码段` 去除结尾多余换行符。 (#292) - 优化:渲染器不兼容时,减少渲染层级错误的影响。 (#259) - 修复:清理图片缓存前进行检查,避免空图错误。 (#279) - 修复:记录面板中,光标无法移到第1个字符前面。 (#264) - 修复:系统语言非简体中文时,软件启动异常。 (#274) (#306) - 修复:csv输出的字符编码兼容性问题。 (#284) - 修复:`段落合并参数不存在` 的误报。 - 修复:组件`DefaultTips`不生效。 ### [v2.0.1](https://github.com/hiroi-sora/Umi-OCR/tree/release/2.0.1) `2023.12.8` 分支名:`release/2.0.1` - 更新:重新设计了OCR HTTP接口,允许省略参数,允许指定段落合并。 - 更新:命令行增加指令`-->`和`-->>`,将结果输出到文件。 - 优化:调整图像数据的内部编码,减少英文空格丢失的几率。 - 优化:调整部分UI文本和布局。 - 优化:csv默认保存为ansi编码,以兼容Office Excel。 (#237) - 修复:开启“禁用美化效果”后,外部通知弹窗无法关闭。 (#234) - 修复:别的程序通过命令行调用Umi-OCR时,无法获取stdout输出。 ### [v2.0.0](https://github.com/hiroi-sora/Umi-OCR/tree/release/2.0.0) `2023.11.19` 分支名:`release/2.0.0` - 优化:插件UI翻译机制。 - 优化:下拉框UI。 - 修复:段落合并-自然段合并的bug。 ### v2.0.0 dev `2023.11.14` - 新增:生成二维码功能。 - 新增:所有图片预览窗口(如截图、二维码页),允许保存图片到指定路径。 - 优化:二维码解析库改用性能更好、功能更丰富的zxingcpp。 ([v2 #47](https://github.com/hiroi-sora/Umi-OCR_v2/issues/47)) (感谢:@Byxs20) - 优化:截图预览面板中,文本框的位置更准确。 - 修复:图片预览窗口,无法复制本地图片的Bug。 - 修复:tbpu合并自然段时,垂直距离不准确的Bug。 - 修复:HTTP API 的跨域问题。 [v2 #52](https://github.com/hiroi-sora/Umi-OCR_v2/issues/52) - 修复:HTTP API 传base64的大小限制问题。 [v2 #49](https://github.com/hiroi-sora/Umi-OCR_v2/issues/49) - 修复:其它少量报错。 - 翻译:人工校对`繁体中文`和`英语`。 (贡献:@QZGao) ### v2.0.0 dev `2023.11.5` - 新增:记忆窗口位置。 [v2 #44](https://github.com/hiroi-sora/Umi-OCR_v2/issues/44) - 新增:批量识图页增加图片预览窗口,单击图片条目打开。 [v2 #2](https://github.com/hiroi-sora/Umi-OCR_v2/issues/2) - 新增:检查软件是否有权限读写配置文件。 [v2 #30](https://github.com/hiroi-sora/Umi-OCR_v2/issues/30) - 新增:报错弹窗提供一键复制及打开issues的功能。 - 新增:全局设置页添加左侧目录栏。 - 新增:插件的多国语言UI机制。 - 优化:截图预览面板中,文本框的位置更准确。 - 优化:调整部分UI布置。 - 修复:扫码模块添加导入异常检查。 [v2 #33](https://github.com/hiroi-sora/Umi-OCR_v2/issues/33) - 修复:补充扫码页的拖入图片功能。 [v2 #43](https://github.com/hiroi-sora/Umi-OCR_v2/issues/43) - 修复:输出到单独文件txt时,文件名去除原后缀。 [v2 #36](https://github.com/hiroi-sora/Umi-OCR_v2/issues/36) - 修复:一些小Bug。 ### v2.0.0 dev `2023.10.25` - 新增:命令行支持传入图片路径。 [v2 #28](https://github.com/hiroi-sora/Umi-OCR_v2/issues/28) - 新增:HTTP接口支持Base64传输图片。 [v2 #28](https://github.com/hiroi-sora/Umi-OCR_v2/issues/28) - 新增:忽略区域功能。 - 新增:二维码识别页。支持识别多种格式的二维码、条形码。 ([Umi-OCR #95](https://github.com/hiroi-sora/Umi-OCR/issues/95)) - 新增:提供备选启动器`UmiOCR-data/RUN_GUI.bat`,供`Umi-OCR.exe`不兼容时使用。 [v2 #21](https://github.com/hiroi-sora/Umi-OCR_v2/issues/21) - 优化:图片预览窗口,支持用`Tab`切换显示/隐藏文本。 - 优化:记录面板,每条记录顶部添加复制按钮。 [v2 #32](https://github.com/hiroi-sora/Umi-OCR_v2/issues/32) - 优化:记录面板,拖拽过程中允许指针移出文本框区域。 [v2 #32](https://github.com/hiroi-sora/Umi-OCR_v2/issues/32) - 优化:重新设计截图缓存机制,避免Image组件销毁时的内存泄露。 - 优化:标签页应用动态解析机制,小幅提高加载速度。 - 优化:运行环境转为64位包。(计划不再提供对32位的兼容) - 修正:配置项中布尔值解析不正确的问题。 [v2 #30](https://github.com/hiroi-sora/Umi-OCR_v2/issues/30) - 修正:拖入非图片文件可能导致卡顿几秒的问题。 - 修正:PaddleOCR插件的兼容性问题。 ([Umi-OCR #209](https://github.com/hiroi-sora/Umi-OCR/issues/209)) ### v2.0.0 dev `2023.10.18` - 新增:截图前自动隐藏窗口。 [v2 #26](https://github.com/hiroi-sora/Umi-OCR_v2/issues/26) - 新增:更改字体功能。 [v2 #25](https://github.com/hiroi-sora/Umi-OCR_v2/issues/25) - 新增:可爱的加载动画。 - 新增:截图预览面板 支持显示结果文本、划选文本。 - 新增:截图预览面板 支持将图片复制到剪贴板。 - 新增:结果记录面板 支持跨文本框划选文本。 [v2 #18](https://github.com/hiroi-sora/Umi-OCR_v2/issues/18) - 新增:结果记录面板 支持删除一条或多条记录。 [v2 #10](https://github.com/hiroi-sora/Umi-OCR_v2/issues/10) - 新增:支持用Esc或右键中断截图。 - 优化:更改插件目录结构和导入机制。 - 修正:文件重复导致无法添加开机自启。 [v2 #27](https://github.com/hiroi-sora/Umi-OCR_v2/issues/27) ### v2.0.0 dev `2023.10.10` - 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题。 [v2 #7](https://github.com/hiroi-sora/Umi-OCR_v2/issues/7) - 新功能:初步实现插件机制,切换引擎等组件更加便捷。 - 新功能:支持调整界面比例(文字大小)。 - 优化:调整截图页UI,提高屏占比。优化标签栏阴影。 [v2 #8](https://github.com/hiroi-sora/Umi-OCR_v2/issues/8) - 优化:双击通知弹窗可打开主窗口。 [v2 #10](https://github.com/hiroi-sora/Umi-OCR_v2/issues/10) - 优化:截图完成后,如果主窗口在前台,则不弹出成功提示。 [v2 #10](https://github.com/hiroi-sora/Umi-OCR_v2/issues/10) - 优化:禁用美化效果时,外部弹窗将不会渲染阴影区域。 [v2 #14](https://github.com/hiroi-sora/Umi-OCR_v2/issues/14) - 优化:Paddle引擎也支持win7系统了。 ### v2.0.0 dev `2023.9.25` ### v2.0.0 dev `2023.9.8` - 支持多种界面语言(实验性) ### v2.0.0 dev `2023.9.7` ### v2.0.0 dev `2023.8.9` - 截图OCR - 兼容高分辨率屏幕和多屏幕系统 - 更准确、智能的段落合并 ### v2.0.0 dev `2023.7.26` - 批量OCR - 现代化UI风格 - 自定义标签页系统 - 主题切换:明亮/深色 --- ### [v1.3.7](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.7) `2023.10.10` - Paddle引擎兼容Win7 x64 。 ### v1.3.6 `2023.9.26` - 新功能:更强大的段落合并方案-`单行/多行自然段/多行代码段`。支持自动判断中/英文段落,采取对应的合并规则。 - 移除一些过时的段落合并方案。 - 功能调整:`截图联动` 划分为独立的功能,不受常规截图OCR影响。 ### [v1.3.5](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.5) `2023.6.20` - 新功能:复制识别结果后,可发送指定按键,以便联动唤起翻译器等工具。 - 新功能:命令行增加切换识别语言的指令。 - 修Bug:低配置机器上有概率误报`OCR init timeout: 5s` 。[#154](https://github.com/hiroi-sora/Umi-OCR/issues/154) , [#156](https://github.com/hiroi-sora/Umi-OCR/issues/156)。 - 调整:默认停止任务30秒后释放一次内存。 ### [v1.3.4](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.4) `2023.4.26` - 新功能:截图预览窗口。 - 新功能:可用方向键微调截图框位置。 - 修Bug:拖入图片时有几率卡退主窗口 [issue #126](https://github.com/hiroi-sora/Umi-OCR/issues/126) 。 - 优化了一些处理流程。 ### [v1.3.3](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.3) `2023.3.19` - 新功能:命令行模式。 - 新功能:识图完成的通知悬浮窗。 - 新功能:自动清理引擎内存。 - 修复了一些BUG,优化了一些UI表现。 ### [v1.3.2](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.2) `2022.12.1` - 新功能:创建开机启动项时,可选`不显示主窗口`。 - 新功能:OCR结果输出到每个图片同名的单独txt文件。 - 新功能:增加独立的设置语言窗口,可在多处点开,便于切换语言。 - 新功能:合并段落添加`合并自然段-西文模式`,可在英文段落换行时补充空格。 - 新功能:快捷识图可选`自动清空面板`,只显示本次识别结果,且隐藏时间信息。 - 修复了一些BUG。 ### [v1.3.1](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.1) `2022.11.4` - 修Bug:快捷键模块重写,引入pynput库,舍弃keyboard库,解决几率失效、录制不正确等Bug。 - 新功能:添加开机自启,桌面快捷方式,开始菜单快捷方式。 - 新功能:多开软件时提示。 - 新功能:截图时隐藏窗口。 - 调整UI:使用频率极低的设置项设为隐藏的高级选项。 - 优化:检查引擎组件是否存在。 - 优化:`横排-合并多行-自然段` 优化逻辑,支持0~2全角空格首行缩进。 ### [v1.3.0](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.3.0) `2022.9.29` - 新功能:框选截屏。 - 新功能:系统托盘图标。 - 新功能:引擎进程常驻。 - 新功能:文本块后处理模块。 - 新功能:自定义主输出栏字体。 - 新功能:设置窗口弹出模式(保持置顶)。 - 调整UI:自适应Win风格组件。 - 修正了Bug:系统语言兼容性问题 [issue #16](https://github.com/hiroi-sora/Umi-OCR/issues/16) 。 - 修正了Bug:微信图片粘贴问题 [issue #22](https://github.com/hiroi-sora/Umi-OCR/issues/22) 。 - 更新PaddleOCR-json模块至`v1.2.1`,提供剪贴板支持。快捷识图通过剪贴板中转,无需再保存临时文件到硬盘。 ### [v1.2.6](https://github.com/hiroi-sora/Umi-OCR/tree/release/1.2.6) `2022.9.1` - 更新PaddleOCR-json模块至`v1.2.0`,提高识别速度、准确度。 - 调整UI:更方便地用下拉框切换识别语言。 - 调整UI:可以从主窗口任意位置/任意选项卡拖入图片。 - 修正了Bug:提高程序健壮性,增加启动子进程时的更多异常处理情况。 - 修正了Bug:彻底解决了对边缘过窄的图片,识别结果不准确的问题 [issue #7](https://github.com/hiroi-sora/Umi-OCR/issues/7) 。 - 优化适配PP-OCRv3模型,彻底解决了v3版模型比v2慢、不准的问题 [issue #4](https://github.com/hiroi-sora/Umi-OCR/issues/4#issuecomment-1141735773) 。 ### v1.2.5 `2022.7.22` - 新功能:计划任务。识图完成后执行自动关机等任务。 - 新功能:可选拖入文件夹时递归导入子文件夹中所有图片。 - 调整UI:添加一些配置文件的快捷入口。 ### v1.2.4 `2022.6.4` - 新功能:可选识别剪贴板图片后自动复制识别的文本。 - 补充功能:快捷键调用剪贴板识图时,若程序窗口被最小化,则恢复前台状态并挪到最前位置。 ### v1.2.3 `2022.5.31` - 新功能:读取剪贴板图片。配置全局快捷键调用该功能。 ### v1.2.2 `2022.4.30` - 新功能:可选任务完成后自动打开输出文件或目录。 ### v1.2.1 `2022.4.16` - 更新PaddleOCR-json模块至`v1.1.1`,修正了可能得到错误包围盒的漏洞。 ### v1.2.0 `2022.4.8` - 可选生成图文链接.md文件,作为索引使用有更佳的观感。 - 修改设置面板的样式,改为滚动面板以容纳更多设置选项。 - 用户修改配置项后可自动保存。 ### v1.1.1 `2022.3.30` - 修正了Bug:退出忽略区域窗口时,OCR子进程未关闭。 ### v1.1.0 `2022.3.30` - 新功能:忽略区域窗口以虚线框 展示识别出的文字块。 ### v1.0.0 `2022.3.28` - “梦开始的地方”