ddddocr根本使用和介绍
ddddocr根本使用和介绍在使用爬虫登录网站的时候,常常输入用户名和暗码后会遇到验证码,这时候就需要用到今天给大家介绍的python第三方库ddddocr,ddddocr是一款强大的通用开源ocr辨认库,具有高效、准确、易用的特点,广泛应用于图像处置惩罚和笔墨辨认任务。本文将为大家介绍ddddocr的根本使用方法,以及示例代码。
一、背景介绍
在计算机视觉和图像处置惩罚领域,数字辨认是一个常见的任务,用于从图像中提取数字并进行辨认。通常,传统的数字辨认算法在单个数字或多位数字的辨认上表现良好,但对于双重数字(两位数字)的准确辨认却面临一些挑衅。这是因为双位数字在视觉上具有相对较高的相似性和重叠特性,使得传统方法的准确率有所下降。
为了办理双重数字辨认的问题,ddddocr项目应运而生。该项目通过使用深度学习的方法,结合卷积神经网络(CNN)和循环神经网络(RNN),对双重数字进行高效准确的辨认。通过训练模子并进行预测,ddddocr能够辨认图像中的双位数字,并输出其详细数值。
该项目具有以下特点和优势:
深度学习:ddddocr使用深度学习技能,特别是卷积神经网络和循环神经网络,对双重数字进行准确的辨认。
开源项目:ddddocr是一个开源项目,允许用户免费使用、修改和分发代码。这使得更多的开发者可以加入其中,贡献自己的想法和改进。
高准确率:通过深度学习的方法,ddddocr在双重数字辨认任务上能够取得较高的准确率,有效克服了传统方法在此任务上的困难。
灵活性:ddddocr提供了训练和预测的功能,用户可以根据自己的需求自定义模子并进行训练,以适应不同的双重数字辨认任务。
ddddocr的目标是提供一个简单而有效的工具,帮助开发者和研究者在双重数字辨认任务上取得更好的效果。通过使用该库,用户可以轻松地集成双重数字辨认功能到自己的应用程序或项目中,实现更准确和可靠的数字辨认功能。
二、安装
直接使用pip安装即可
pip install ddddocr安装完成后就可以在python代码中引入ddddocr库了
import ddddocr三、使用示例
[*]辨认英文数字验证码
https://raw.githubusercontent.com/gggod11/typora_pic/main/img/202404191422265.png
https://raw.githubusercontent.com/gggod11/typora_pic/main/img/202404191422308.png
代码示例
# test.py
import ddddocr
ocr = ddddocr.DdddOcr(show_ad=False)# show_ad=False关闭广告
with open("./img/1.jpg", "rb") as f1:
im = f1.read()
yzm1 = ocr.classification(im)
with open("./img/2.jpg", "rb") as f2:
im = f2.read()
yzm2 = ocr.classification(im)
print(yzm1, yzm2)运行效果
https://raw.githubusercontent.com/gggod11/typora_pic/main/img/202404191422014.png
[*]辨认滑块验证码
https://raw.githubusercontent.com/gggod11/typora_pic/main/img/202404191423449.png
https://raw.githubusercontent.com/gggod11/typora_pic/main/img/202404191357773.png
代码示例
# test.py
import ddddocr
det = ddddocr.DdddOcr(det=False, ocr=False, show_ad=False)# show_ad=False关闭广告
with open('img/target.png', 'rb') as f:
target_bytes = f.read()
with open('img/background.jpg', 'rb') as f:
background_bytes = f.read()
res = det.slide_match(target_bytes, background_bytes, simple_target=True)
print(res)运行效果
https://raw.githubusercontent.com/gggod11/typora_pic/main/img/202404191358924.png
一般只会用到res['target'],这个就是滑块需要滑动的隔断。在实际应用中每个网站可能会有偏差,所以要对滑块轨迹进行微调,可以根据网站的滑块和背景图的大小对res['target']进行加减
[*]辨认中文点选验证码
https://raw.githubusercontent.com/gggod11/typora_pic/main/img/202404191423550.png
代码示例
# test.py
import ddddocr
import cv2
det = ddddocr.DdddOcr(det=True, show_ad=False)# show_ad=False关闭广告
with open("./img/dianxuan.jpg", 'rb') as f:
image = f.read()
poses = det.detection(image)
print(poses)
im = cv2.imread("./img/dianxuan.jpg")
for box in poses:
x1, y1, x2, y2 = box
im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)
cv2.imwrite("./img/result.jpg", im)运行效果
https://raw.githubusercontent.com/gggod11/typora_pic/main/img/202404191423244.png
四、总结
本文介绍了使用ddddocr辨认英文数字验证码、滑块验证码和中文点选验证码的过程,ddddocr在对图片不进行任何处置惩罚的情况下辨认服从已经非常高了,我们在实际应用场景中还可以根据自身需求对图片进行进一步的处置惩罚提高辨认率。在遇到一些复杂难以辨认的验证码时我们可以对其进行深度学习训练,详细实现流程可以参考我前面的博客。此外,ddddocr里面还很多值得学习的东西,有爱好的小伙伴可以自行研究。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]