免费入驻
产品入驻解决方案入驻公司入驻案例入驻
登录 · 注册
- 只需一步，快速开始
- 账号登录
- 立即注册
- 找回密码
自动登录找回密码

密码立即注册

IT评测·应用市场-qidao123.com»论坛 › 软件与程序人生 › DevOps与敏捷开发 › 怎样用Python将pdf文件转化为高清图片

怎样用Python将pdf文件转化为高清图片

宝塔山论坛元老 | 2025-1-23 05:31:34 | 显示全部楼层 | 阅读模式

上一主题

下一主题

楼主

主题 1015|帖子 1015|积分 3045

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

x

最近在整理文档，需要将文档进行OCR辨认，然后布局化。直接解析pdf文档，行不通，由于文档里面是图片。于是采取先转图片，然后OCR，然后布局化。下面是pdf文档转图片的方法。

import fitz # PyMuPDF
def pdf_to_images(pdf_path, images_folder):
# 打开PDF文件
document = fitz.open(pdf_path)
for page_num in range(len(document)):
# 获取页面
page = document[page_num]
# 将页面渲染为图片，默认输出为RGB颜色空间，96 DPI
pix = page.get_pixmap(dpi=300)
# 图片文件名
image_name = f"page_{page_num + 1}.png"
image_path = f"{images_folder}/{image_name}"
# 保存图片
pix._writeIMG(image_path, format_="JPG", jpg_quality=300)
# 关闭PDF文档
document.close()
# 使用示例
pdf_path = 'example.pdf' # PDF文件路径
images_folder = 'images' # 图片保存文件夹
pdf_to_images(pdf_path, images_folder)

复制代码

清楚度可以通过dpi参数控制。
如果你还没有安装 pymupdf，请安装：

pip install pymupdf

复制代码

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

回复

使用道具举报

0 个回复

倒序浏览

快速回复

微信订阅号

微信服务号

微信客服

小程序

H5

关于我们商务合作网站地图

快速回复 返回顶部 返回列表