羊蹓狼 发表于 2024-11-15 03:08:58

小试银河麒麟系统OCR软件

0 媒介

今天在国产电脑上办公,需要从一些PDF文件中复制笔墨内容,但是这些PDF文件是图片转换天生的,不支持笔墨选择和复制,除了手工输入,我们还可以使用OCR。

1 什么是OCR

OCR (Optical Character Recognition,光学字符识别),最初是指电子设备(比方扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机笔墨的过程;随着软件功能的发展,也可以将图片、PDF等电子文件的笔墨转换成为好坏点阵的图像文件,并通过识别软件将图像中的笔墨转换成文本格式,供笔墨处理软件进一步编辑加工的技术。
现在,不管是Windows系统,照旧基于Linux的系统,都提供了具有OCR功能的软件。
2 Windows平台上的OCR软件

在Windows平台上,有很多OCR软件,比力常见和常用的有:

[*] Adobe Acrobat Pro:Adobe提供的全功能PDF编辑和处理工具,此中包罗OCR功能。
[*] ABBYY FineReader:一款功能强大的OCR软件,可以将扫描的文档、PDF文件等转换为可编辑的文本格式。
[*] Omnipage Ultimate:识别准确率较高的OCR软件,支持批量处理和主动化的工作流程。
[*] Readiris:适用于扫描仪和多功能设备的OCR软件,可以将纸质文档转换为可编辑的电子文件。
[*] Nitro Pro:一款PDF编辑和管理工具,也具备OCR功能。
[*] FreeOCR:一款免费的OCR软件,虽然功能相对较简朴,但适合个人和小型项目使用。
[*] 一些扫描仪也配备了OCR软件,比如汉王OCR。                                                     
这些软件都可以将扫描的文档或图片中的笔墨识别并转换为可编辑的文本格式。用户可以根据自己的需求和预算选择适合自己的OCR软件。
不仅云云,腾讯的QQ、微信都提供了对图片的笔墨提取功能。
免费开源的图片欣赏软件irfanView也以插件的情势提供了OCR功能,不过只能识别英文。
因此,在Windows平台上,使用OCR技术来提取图片或电子文档中的笔墨非常方便。
3  银河麒麟系统上的OCR软件

银河麒麟系统上的QQ、微信目前还不能像在Windows平台上一样支持对图片中笔墨的提取。
打开银河麒麟系统的软件商店,直接搜索OCR,结果如下:
https://i-blog.csdnimg.cn/direct/bf04515101b54107a010485ef0accb16.jpeg
目前有5款软件。
3.1 OCRFeeder

OCRFeeder 是 GNOME 桌面下的一个开源 OCR 套件。可将纸质或者图形文档转成电子文档。
https://i-blog.csdnimg.cn/direct/c62891e88c7c4e2db38246b571fb59e3.jpeg
看起来不错,可惜安装后运行不了。
从软件下面的评论来看,不止我一个人碰到这个问题。
https://i-blog.csdnimg.cn/direct/906690427d5c4347a899e3914d5585b7.jpeg

3.2 The OCR-A

这只是一种字体,不是一个软件。所以安装后只会显示“已安装”。
https://i-blog.csdnimg.cn/direct/6abfba5d48d24864b8093b7835ccfad6.jpeg
3.3  成者采编王(图像编辑PDF/OFD扫描及笔墨识别OCR软件)

https://i-blog.csdnimg.cn/direct/52b9465ebf5d42e5bbb007b5167bf77b.jpeg
安装,运行,打开上面这张照片,点击框选OCR功能按钮,选择图中的软件介绍这部分笔墨
https://i-blog.csdnimg.cn/direct/be179a13eafb4893a100f8c9df0b4430.png
在图片右侧显示出了OCR的结果:
   软件介绍
成者采编王,是专业的图像文档编辑和ocr识别软件
成者采编王(图像编辑PDF/OFD扫描打印及笔墨识别OCR软件),是专业的图像处理和ocr识别软件,是成者为国产化平台倾力打造的桌面端办公应用软件,利用图像算法的优势,实现快捷的图像处理方式和高效的批量图片处理和准确的笔墨识别功能。集成了标准的SANE扫描仪/摄像头类拍摄仪采集功能,实现数据的采集录入。同时集成了标准打印文档模块,为日常办公提供便利。软件使用自研“成者远识”笔墨识别系统引擎,通过机器学习AI算法完成对海量数据的采样和标定,可快速批量的将图片转化成笔墨,对中准确识别率高。支持xt,docx,双层pdf,xlsx的格式导出,可轻松完成笔墨的编辑、检索等工作,完成纸质文件的无纸化转换。支持文件夹快速切换,图像缩略图预览,支持多文件选取,支持批量功能操作,如颜色处理、旋转、裁剪、规格化、重定名,笔墨识别等功一个安装包揽理图像处理和笔墨识别的问题,以极小体积的本地数据库完成对笔墨的识别,无需互联网即可使用,安全应用防止数据泄露。专业的UI设计及交互设计团队,精心打造每一个细节,让用户越用越流畅,越便捷。软件版本会持续送代,功能和体验持续升级更新。预置白纸印章、证件底纹等颜色模式,实现快速切换。效率高,效果好
识别率不错。
这个软件的评论区里也有不少用户发表的评论:
https://i-blog.csdnimg.cn/direct/f09547c2548e421b89c9b63a3ad4d0f9.jpeg
https://i-blog.csdnimg.cn/direct/8a09bfab35094ac697a54450fd598f65.jpeg

就是没注册,不知道使用时是否存在功能限定。

3.4 截屏OCR

https://i-blog.csdnimg.cn/direct/452a877e1f244beaad2413a0b1b54e6a.jpeg
从软件介绍来看好像不错。
安装后运行,提示要在应用商店下载依赖系统<电子档案管理系统>。
https://i-blog.csdnimg.cn/direct/ead304be0c12432eb7054089f3466044.jpeg
3.5 Online OCR网页版

https://i-blog.csdnimg.cn/direct/5a8bcab4600846c89a1e61077a432cdb.jpeg

从软件介绍来看,这是一个在线OCR笔墨识别软件,从PDF或图片(支持JPG.BMP)中识别提取出笔墨,并将其转换成Word/ExceUTXT文档。
安装后打开,会使用欣赏器打开网址:免费在线OCR - 将PDF转换为Word或图像转换为文本
https://i-blog.csdnimg.cn/direct/af77f0eb9af24621bbc0c71e20146b37.png
网页中提示了操作步骤:
第一步,选择并上传文件
第二步,选择识别语言和输出文件格式,我们要识别简体中文的话,可以选择 CHINESESMPLIFIED
第三步,识别并转换
对于一般的文件,可以上传和识别
如果是敏感的文件,就不能上传和识别了。
4 小结

颠末测试,在银河麒麟系统软件商店中搜索出了5个OCR软件,此中一个The OCR-A实际是字体而非软件,所以实际上只有4个,在这4个软件中,OCRFeeder运行不了,截屏OCR不能单独使用,Online OCR网页版需要连接互联网,而且不能处理敏感信息,所以真正可以放心使用的只有成者采编王(图像编辑PDF/OFD扫描及笔墨识别OCR软件)。


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 小试银河麒麟系统OCR软件