6款开源中文OCR使用先容(亲测效果)

打印 上一主题 下一主题

主题 974|帖子 974|积分 2924

媒介

光学字符辨认(Optical Character Recognition, OCR)是指对文本材料的图像文件举行分析辨认处置惩罚,以获取文字和版本信息的过程。也就是说将图象中的文字举行辨认,并返回文本形式的内容。
ocr主要流程:

随着ocr技术的日渐成熟,现在github中有许多开源项目可供选择,下面将先容几种常用的开源ocr项目。
开源ocr项目

1. Paddle OCR(推荐指数:★★★★★)

1.1 简介

飞桨首次开源文字辨认模子套件PaddleOCR,目标是打造丰富、领先、实用的文本辨认模子/工具库。最新开源的超轻量PP-OCRv3模子大小仅为16.2M。同时支持中英文辨认;支持倾斜、竖排等多种方向文字辨认;支持GPU、CPU预测;用户既可以通过PaddleHub很便捷的直接使用该超轻量模子,也可以使用PaddleOCR开源套件训练本身的超轻量模子。
1.2 使用

安装使用说明
1.3 优缺点



  • 优点

    • 轻量模子,执行速度快
    • 支持pip直接安装
    • ocr辨认效果好,效果基本可以比肩大厂收费ocr(非高精版)
    • 支持表格和方向辨认
    • 支持增补训练且很方便

  • 缺点

    • 部分符号辨认效果一样平常,如 '|‘辨认为’1’
    • 对于部分加粗字体可能出现误辨认,需要本身增补训练
    • 偶然会出现部分内容丢失的情况

2. CnOCR(推荐指数:★★★★★)

2.1 简介

CnOCR 是 Python 3 下的文字辨认(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模子)、英文和数字的常见字符辨认,支持竖排文字的辨认。自带了20+个训练好的辨认模子,实用于差别应用场景,安装后即可直接使用。同时,CnOCR也提供简朴的训练命令供使用者训练本身的模子。
2.2 使用

安装使用说明
2.3 优缺点



  • 优点

    • 轻量模子,执行速度快,速度略快于paddle ocr
    • 支持pip直接安装
    • ocr辨认效果好,辨认效果比肩paddle ocr
    • 支持训练本身的模子

  • 缺点

    • 部分符号辨认效果差
    • 部分场景下会出现空格丢失情况
    • 模子增补训练没有paddle ocr方便

3. chinese_lite OCR(推荐指数:★★★)

3.1简介

超轻量级中文 ocr,支持竖排文字辨认, 支持 ncnn、mnn、tnn 推理, 模子大小仅4.7M。
3.2 使用

安装使用说明
3.3 优缺点



  • 优点

    • 轻量模子,执行速度快,速度优于CnOCR和Paddle OCR
    • ocr辨认效果尚可,优于一样平常开源模子,但比不上CnOCR和Paddle OCR
    • 作者提供了多种语言下的Demo

  • 缺点

    • 不支持pip安装
    • 文本位置辨认略差
    • 不支持增补训练
    • 类手写字体辨认效果一样平常
    • 部分场景下会出现误辨认竖版文字的情况
      比方:
    1. 姓     名: 张三
    2. 性     别: 男
    3. 年     龄: 19
    4. 户     籍: 北京
    5. 误识别为 '姓性年户'
    复制代码

4. EasyOCR(推荐指数:★★)

4.1 简介

EasyOCR是一个用于从图像中提取文本的python模块。它是一种通用的OCR,可以读取自然场景文本和文档中的密集文本。我们现在正在支持80多种语言并不断扩展。
4.2 使用

官方文档
4.3 优缺点



  • 优点

    • 支持pip安装,但需要本身手动下载模子
    • ocr辨认效果尚可,优于一样平常开源模子

  • 缺点

    • 速度很慢,900 * 1200像素图片平均需要30s左右
    • 不支持增补训练

5. Tesseract OCR(推荐指数:★)

5.1 简介

Tesserat OCR 是一款可在各种操作体系运行的 OCR 引擎,这是一款开源软件,在Apache 许可下发布。最初由惠普在20世纪80年代作为专有软件开发,在2005年以开源的形式发布,从2006年开始由谷歌赞助,开发语言为 C++。
5.2 使用

官方文档
5.3 优缺点



  • 优点

    • 支持增补训练

  • 缺点

    • 安装使用困难,不支持pip安装
    • 中文辨认效果差

6. chineseocr(推荐指数:★★)

6.1 简介

基于yolo3 与crnn 实现中文自然场景文字检测及辨认


  • 文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)
  • 支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练
  • 不定长OCR训练(英文、中英文) crnn\dense ocr 辨认及训练 ,新增pytorch转keras模子代码(tools/pytorch_to_keras.py)
  • 支持darknet 转keras, keras转darknet, pytorch 转keras模子
  • 身份证/火车票结构化数据辨认
  • 新增CNN+ctc模子,支持DNN模块调用OCR,单行图像平均时间为0.02秒以下
    CPU版本加速
  • 支持基于用户字典OCR辨认
  • 新增语言模子修正OCR辨认结果
  • 支持树莓派实时辨认方案
6.2 使用

官方文档
6.3 优缺点



  • 优点

    • 支持增补训练
    • 有多版本优化模子

  • 缺点

    • 项目较老,使用的三方库较老,部分三方库已废弃,环境设置困难
    • 中文ocr辨认效果一样平常
    • 不支持pip安装

总结

上述6个开源模子是常见的国内ocr模子,每个我都摆设测试过,团体来看推荐使用paddle ocr和cnocr,某些场景下,如小图片且对速度要求较高可以尝试使用chinese_lite ocr.



有其他开源中文ocr推荐,欢迎增补!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

南七星之家

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表