论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
数据库
›
Oracle
›
OCR(Optical Character Recognition),光学字符辨认 ...
OCR(Optical Character Recognition),光学字符辨认
石小疯
论坛元老
|
昨天 04:00
|
显示全部楼层
|
阅读模式
楼主
主题
1853
|
帖子
1853
|
积分
5559
参考:如何让机器读懂图片上的笔墨?飞桨助您快速了解OCR - 知乎
OCR(Optical Character Recognition),译为光学字符辨认,是指通过扫描等光学输入方式将各种单子、报刊、书籍、文稿及其它印刷品的笔墨转化为图像信息,再利用笔墨辨认技术将图像信息转化为可以利用的盘算机输入技术。
OCR技术的应用场景非常广泛:
(1)拍照/截图辨认
利用OCR技术,实现拍照笔墨辨认、相册图片笔墨辨认和截图笔墨辨认,可应用于搜索、书摘、条记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户利用体验。
(2)内容审核与监管
(3)视频内容分析
(4)纸质文档电子化
OCR技术原理
图像处理阶段:包含图像输入、图像预处理、版面分析、字符切割等子步骤。
笔墨辨认阶段:包含特性提取、字符辨认、版面规复、后处理等子步骤。
【文本检测】
图像输入:读取差异格式的图像文件。
图像预处理:包含灰度化、二值化、图像降噪、倾斜矫正等预处理步骤。
版面分析:针对左右两栏等特殊排版,进行版面分析并划分段落。
字符切割:对图像中的文本进行字符级的切割,尤其注意字符粘连等标题。
【文本辨认】
特性提取:对字符图像提取关键特性并降维,用于后续的字符辨认算法。
字符辨认:依据特性向量,基于模版匹配分类法或深度神经网络分类法,辨认出字符。
版面规复:辨认原文档的排版,按照原排版的格式将辨认结果输出。
后处理:引入语言模子或人工检查,修正“分”和“兮”等形近字。
参考:OCR二次
开发
宝典:飞桨联合多家企业和高校发布《OCR产业范例20讲》 - 知乎
基于PaddleOCR完成一个范例的完整流程一样平常包含数据准备、模子训练、推理摆设三个部门,具体来说:
模子训练
PP-OCR和PP-Structure系列模子都利用了大量训练数据,在通用场景可以一定程度地包管精度和泛化性,因此一样平常发起基于飞桨PP系列模子进行模子微调(finetune),从而实现利用较少的业务数据达到预期效果。基于差异场景业务数据训练的模子,有时必要针对前后处理进行任务适配,往往能进一步提升团体效果,偶尔乃至有“奇效”。如车牌辨认范例中,通过后处理优化特殊符号的辨认结果,大幅提升了团体辨认精度。
银行回单是企业财务记账的重要原始凭证之一。目前是由财务职员进行人工读取,提取账单中的收付款人、流水单号、金额等关键信息,联合财务记账规则进行处理,加工成记账凭证、资产负债表、开具发票。针对该场景,本范例基于PP-Structure训练命名实体辨认、关系抽取模子并基于Hub Serving完成关键信息抽取的服务化摆设,实现代替记账公司实现自动化记账报税功能。
文档场景信息抽取v4产线 - PaddleX 文档
通用OCR产线 - PaddleX 文档
OCR(光学字符辨认,Optical Character Recognition)是一种将图像中的笔墨转换为可编辑文本的技术。它广泛应用于文档数字化、信息提取和数据处理等领域。OCR 可以辨认印刷文本、手写文本,乃至某些类型的字体和符号。
通用 OCR 产线用于解决笔墨辨认任务,提取图片中的笔墨信息以文本形式输出,本产线集成了业界知名的 PP-OCRv3 和 PP-OCRv4 的端到端 OCR 串接洽统,支持超过 80 种语言的辨认,并在此基础上,增长了对图像的方向矫正和扭曲矫正功能。基于本产线,可实现 CPU 上毫秒级的文本内容精准推测,利用场景覆盖通用、制造、金融、交通等各个领域。本产线同时提供了灵活的服务化摆设方式,支持在多种硬件上利用多种编程语言调用。不但云云,本产线也提供了二次
开发
的本事,您可以基于本产线在您本身的数据集上训练调优,训练后的模子也可以无缝集成。
通用OCR产线中包含必选的文本检测模块和文本辨认模块,
以及可选的文档图像方向分类模块、文本图像矫正模块和文本行方向分类模块。此中,文档图像方向分类模块和文本图像矫正模块作为文档预处理子产线被集成到通用OCR产线中。
如果您更注重模子的精度,请选择精度较高的模子;如果您更在意模子的推理速度,请选择推理速度较快的模子;如果您关注模子的存储巨细,请选择存储体积较小的模子。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
石小疯
论坛元老
这个人很懒什么都没写!
楼主热帖
解决图片无法设置hover,以设置图片的 ...
SQL的多表查询
C# GDI+ 画心形 跳动动画
解决OpenCV的imread/imwrite在Qt环境不 ...
几个函数的使用例子:更新VBRK-XBLNR, ...
Hive安装与启动
qrtz表初始化脚本_mysql
MySQL基础(DDL、DML、DQL)
堆Pwn:House Of Storm利用手法
OpenHarmonyOs / LiteOs-a 开发环境搭 ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
开源技术
容器及微服务
数据仓库与分析
运维.售后
IOS
Postrge-SQL技术社区
数据安全
Mysql
主机安全
快速回复
返回顶部
返回列表