ocrmypdf使用时的cannot import name ‘PdfMatrix‘ from ‘pikepdf‘题目 ...

打印 上一主题 下一主题

主题 989|帖子 989|积分 2967

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
最近在做pdf的ocr,之前使用过ocrmypdf,打算再次使用,发现它更新了,所以就打算使用最新版
环境:win11+anaconda
创建假造环境后安装语句:
pip install ocrmypdf -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install tesseract -i https://pypi.tuna.tsinghua.edu.cn/simple
然后使用时发现报错了:cannot import name 'PdfMatrix' from 'pikepdf'
查了一下网站:v9.5.1 — pikepdf 9.5.1 documentation
发现pikepdf在v9.0.0版本时Removed deprecated pikepdf.PdfMatrix. Use pikepdf.Matrix instead.
它移除了PdfMatrix模块,改了个名字。
试了一下同步修改ocrmypdf的两个文件,发现还是有一部分pdf在ocr时会报错,懒得研究了,就把pikepdf的版本修改为:v8.15.1即可
pip install pikepdf==8.15.1
ps:记得ocrmypdf还需要依赖Ghostscript,需要官网下载即可:Ghostscript : Downloads


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

小秦哥

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表