马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
最近在整理文档,需要将文档进行OCR辨认,然后布局化。直接解析pdf文档,行不通,由于文档里面是图片。于是采取先转图片,然后OCR,然后布局化。下面是pdf文档转图片的方法。
- import fitz # PyMuPDF
-
- def pdf_to_images(pdf_path, images_folder):
- # 打开PDF文件
- document = fitz.open(pdf_path)
-
- for page_num in range(len(document)):
- # 获取页面
- page = document[page_num]
-
- # 将页面渲染为图片,默认输出为RGB颜色空间,96 DPI
- pix = page.get_pixmap(dpi=300)
-
- # 图片文件名
- image_name = f"page_{page_num + 1}.png"
- image_path = f"{images_folder}/{image_name}"
-
- # 保存图片
- pix._writeIMG(image_path, format_="JPG", jpg_quality=300)
-
- # 关闭PDF文档
- document.close()
-
- # 使用示例
- pdf_path = 'example.pdf' # PDF文件路径
- images_folder = 'images' # 图片保存文件夹
- pdf_to_images(pdf_path, images_folder)
复制代码 清楚度可以通过dpi参数控制。
如果你还没有安装 pymupdf,请安装:
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |