IT评测·应用市场-qidao123.com技术社区
标题:
OCR(Optical Character Recognition),光学字符辨认
[打印本页]
作者:
石小疯
时间:
前天 04:00
标题:
OCR(Optical Character Recognition),光学字符辨认
参考:如何让机器读懂图片上的笔墨?飞桨助您快速了解OCR - 知乎
OCR(Optical Character Recognition),译为光学字符辨认,是指通过扫描等光学输入方式将各种单子、报刊、书籍、文稿及其它印刷品的笔墨转化为图像信息,再利用笔墨辨认技术将图像信息转化为可以利用的盘算机输入技术。
OCR技术的应用场景非常广泛:
(1)拍照/截图辨认
利用OCR技术,实现拍照笔墨辨认、相册图片笔墨辨认和截图笔墨辨认,可应用于搜索、书摘、条记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户利用体验。
(2)内容审核与监管
(3)视频内容分析
(4)纸质文档电子化
OCR技术原理
图像处理阶段:包含图像输入、图像预处理、版面分析、字符切割等子步骤。
笔墨辨认阶段:包含特性提取、字符辨认、版面规复、后处理等子步骤。
【文本检测】
图像输入:读取差异格式的图像文件。
图像预处理:包含灰度化、二值化、图像降噪、倾斜矫正等预处理步骤。
版面分析:针对左右两栏等特殊排版,进行版面分析并划分段落。
字符切割:对图像中的文本进行字符级的切割,尤其注意字符粘连等标题。
【文本辨认】
特性提取:对字符图像提取关键特性并降维,用于后续的字符辨认算法。
字符辨认:依据特性向量,基于模版匹配分类法或深度神经网络分类法,辨认出字符。
版面规复:辨认原文档的排版,按照原排版的格式将辨认结果输出。
后处理:引入语言模子或人工检查,修正“分”和“兮”等形近字。
参考:OCR二次开发宝典:飞桨联合多家企业和高校发布《OCR产业范例20讲》 - 知乎
基于PaddleOCR完成一个范例的完整流程一样平常包含数据准备、模子训练、推理摆设三个部门,具体来说:
模子训练
PP-OCR和PP-Structure系列模子都利用了大量训练数据,在通用场景可以一定程度地包管精度和泛化性,因此一样平常发起基于飞桨PP系列模子进行模子微调(finetune),从而实现利用较少的业务数据达到预期效果。基于差异场景业务数据训练的模子,有时必要针对前后处理进行任务适配,往往能进一步提升团体效果,偶尔乃至有“奇效”。如车牌辨认范例中,通过后处理优化特殊符号的辨认结果,大幅提升了团体辨认精度。
银行回单是企业财务记账的重要原始凭证之一。目前是由财务职员进行人工读取,提取账单中的收付款人、流水单号、金额等关键信息,联合财务记账规则进行处理,加工成记账凭证、资产负债表、开具发票。针对该场景,本范例基于PP-Structure训练命名实体辨认、关系抽取模子并基于Hub Serving完成关键信息抽取的服务化摆设,实现代替记账公司实现自动化记账报税功能。
文档场景信息抽取v4产线 - PaddleX 文档
通用OCR产线 - PaddleX 文档
OCR(光学字符辨认,Optical Character Recognition)是一种将图像中的笔墨转换为可编辑文本的技术。它广泛应用于文档数字化、信息提取和数据处理等领域。OCR 可以辨认印刷文本、手写文本,乃至某些类型的字体和符号。
通用 OCR 产线用于解决笔墨辨认任务,提取图片中的笔墨信息以文本形式输出,本产线集成了业界知名的 PP-OCRv3 和 PP-OCRv4 的端到端 OCR 串接洽统,支持超过 80 种语言的辨认,并在此基础上,增长了对图像的方向矫正和扭曲矫正功能。基于本产线,可实现 CPU 上毫秒级的文本内容精准推测,利用场景覆盖通用、制造、金融、交通等各个领域。本产线同时提供了灵活的服务化摆设方式,支持在多种硬件上利用多种编程语言调用。不但云云,本产线也提供了二次开发的本事,您可以基于本产线在您本身的数据集上训练调优,训练后的模子也可以无缝集成。
通用OCR产线中包含必选的文本检测模块和文本辨认模块,
以及可选的文档图像方向分类模块、文本图像矫正模块和文本行方向分类模块。此中,文档图像方向分类模块和文本图像矫正模块作为文档预处理子产线被集成到通用OCR产线中。
如果您更注重模子的精度,请选择精度较高的模子;如果您更在意模子的推理速度,请选择推理速度较快的模子;如果您关注模子的存储巨细,请选择存储体积较小的模子。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
欢迎光临 IT评测·应用市场-qidao123.com技术社区 (https://dis.qidao123.com/)
Powered by Discuz! X3.4