项目
| 优点
| 缺点
|
tesseract
| 1、github上面star非常多,项目非常活跃
2、多语言支持:Tesseract支持多种语言的文本辨认,可以处理多种语言的文本
3、后面做背书的公司非常强(google)
4、Tesseract提供了扩展接口和工具,可以自定义训练和优化OCR模子
| 1、不是专门针对中文场景
2、相干文档重要是英文,对于阅读和明白起来有一定困难
3、学习成本比较高
4、对于复杂字形和字体的辨认准确性较低
5、与其他OCR相比,Tesseract的准确率大概相对较低
|
PaddleOCR
| 1、github上面star非常多,项目非常活跃
2、模子只针对中文举行训练
3、百度后面做背书,公司非常强
4、提供了多种预训练模子和接口,支持用户举行自定义训练和优化
5、辨认的精确度比较高
| 1、安装和设置相对复杂一些,须要一定的技能知识和履历
2、对于一些较小的笔墨或低分辨率的图像,PaddleOCR的性能大概受到影响
3、利用的训练模子是基于百度公司自己的PaddlePaddle框架,对于小公司来说并不主流(对比于ts大概pytorch),所利用深度学习框架为后续其他深度学习无法做很好的铺垫
4、项目整体比较复杂,学习成本较高
|
EasyOCR
| 1、github上面的star也是比较多
2、支持的语言也黑白常多的,多达80多种
3、辨认的精确度尚可
| 1、从官方的页面体验来说辨认的速率较慢
2、辨认的笔墨种类多,学习难度较高
3、相干的官方文档是基于英文的,学习难度较高,对于新手不太友好
4、由于模子较大,EasyOCR的内存占用较高
|
chineseocr
| 1、github上面的star也是比较多
2、专门针对中文举行学习和训练的模子
3、具有一定的准确性和可扩展性
| 1、须要一定的技能知识和履历来举行安装和设置。
2、文档和社区支持相对较少
|
chineseocr_lite
| 1、github上面的star也是比较多
2、专门针对中文举行学习和训练的模子
3、比较轻量级,具有较小的模子和内存占用
4、由于模子较小,chineseocr_lite具有较快的文本辨认速率
| 1、因为没有大厂和公司的背书, 所以存在一些bug
2、对于复杂场景下的结果不佳
3、准确率相对较低
4、功能和扩展性相对有限
|
CNOCR
| 1、高准确率:cnocr利用深度学习模子实现高准确率的中文文本辨认。
2、简单易用:cnocr提供了简单易用的API和下令行界面,方便用户集成和利用。
3、快速辨认:cnocr颠末优化,可以或许快速处理图像并举行实时的中文文本辨认。
| 1、依赖深度学习框架:cnocr依赖于深度学习框架,因此在利用之前须要安装相应的框架和依赖库。
2、仅支持中文文本:cnocr重要用于中文文本辨认,对于其他语言的文本辨认支持有限。
|
|
|
|