OCR软件全称Optical Character Recognitio,翻译成汉语是“光学字符识别”,通常我们俗称“文字识别”。有时我们对文档中的文字进行复制时,可能由于是扫描版或图片版,这时就需要用到文字识别软件了。此前我专门介绍过,并推荐了几款《OCR软件》,但是需要联网使用,今天再推荐一款开源免费、离线版的OCR软件「Umi-OCR」。
具有截图OCR、批量OCR、PDF识别、二维码、公式识别(此功能正在测试中)等强大的功能,包含简体中文、繁体中文、英文等多种语言。软件UI包含标签页,使用起来很方便。适用于 Windows7 x64及以上系统。
支持截图/批量OCR/批量文档,可以使用软件自带的截图功能,或者把图片/文档拖入软件空白处,抑或是直接粘贴图片。OCR识别后还可以进行排版,软件内置了多种排版格式,这样更方便阅读,这一点是很多OCR软件不具备的。还支持读取二维码、条形码,支持19种协议。
支持数学公式识别,能支持这个功能的OCR软件不多。但是需要自行导入插件,下面介绍一下使用方法:
①前往Gayhub下载公式插件win7_x64_Pix2Text(文末提供了下载地址)。
②将上述插件解压后,放到UmiOCR-data\plugins目录(Umi-OCR的解压目录)下。
③打开Umi-OCR,依次点击:全局设置→文字识别→接口改为Pix2Text→点击应用修改。然后就可以正常使用Umi-OCR了。
另外,在设置中建议关闭“启用文字识别”,这样公式识别的准确率更高。
下面我将一张图片中的公式进行识别,准确率还是相当高的,识别后是一串Latex代码,把这串代码复制到下述网址,即可生成公式。
注:Pix2Text插件原作者正在测试中,识别精度还会再提高,可以跟踪一下这个软件。原作者表示Umi-OCR未来将具有独立的公式识别标签页,并提供Latex实时预览等功能。
https://simpletex.cn
下载地址
本软件有两个版本Umi-OCR_Paddle和Umi-OCR_Rapid:Paddle体积更大,性能更好,但是对电脑配置要求也高;Rapid体积小,相对而言可以用于配置略低的电脑。软件下载后,解压后即可直接使用。
Umi-OCR项目地址:
https://github.com/hiroi-sora/Umi-OCR
Umi-OCR插件地址:
https://github.com/hiroi-sora/Umi-OCR_plugins/releases
本文所有软件(含插件)备份下载:
https://www.123pan.com/s/xY3DVv-h9TAA.html
提取码:NM5E
评论前必须登录!
立即登录 注册