如何通过Java应用程序压缩PDF文档

打印 上一主题 下一主题

主题 842|帖子 842|积分 2528

 PDF文档是我们日常办公中使用最频繁的文档格式。但因为大多数PDF文档都包含很多页面图像或大量图片,这就导致PDF文档过大,处理起来较为麻烦。PDF文件过大,就会导致传输或者下载的速度变慢,也会增加传输失败的风险,影响办公效率。因此我们需要对PDF文档进行压缩。本文将从以下两方面介绍如何通过Java应用程序压缩PDF文档。

在使用PDF文件过程中,经常会出现由于体积过大导致文件传输失败的情况。遇到这种情况,我们可以先将PDF文件压缩一下再进行传输。而除了压缩文档内容以外,压缩图片是缩小PDF文档的主要方法之一。本文将分为2部分分别介绍如何通过Java代码压缩PDF文档。希望这篇文章能对大家有所帮助。


  •  压缩PDF文档中的内容及图片
  • 压缩PDF文档中的高分辨率图片

1.引入jar

导入方法1:
手动引入。将 Free Spire.PDF for Java 下载到本地,解压,找到lib文件夹下的Spire.PDF.jar文件。在IDEA中打开如下界面,将本地路径中的jar文件引入Java程序:

导入方法2:如果您想通过 Maven安装,则可以在 pom.xml 文件中添加以下代码导入 JAR 文件。
  1. <repositories>
  2.         <repository>
  3.             <id>com.e-iceblue</id>
  4.             <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
  5.         </repository>
  6.     </repositories>
  7. <dependencies>
  8.     <dependency>
  9.         <groupId>e-iceblue</groupId>
  10.         <artifactId>spire.pdf.free</artifactId>
  11.         <version>5.1.0</version>
  12.     </dependency>
  13. </dependencies>
复制代码
 压缩PDF文档中的内容及图片

 压缩PDF文档中的内容及图片的详细步骤如下:


  • 创建 PdfDocument 类的对象。

  • 使用 PdfDocument.loadFromFile() 方法加载 PDF 文档。

  • 使用 PdfDocument.getFileInfo().setIncrementalUpdate() 方法将增量更新设置为false。

  • 使用 PdfDocument.setCompressionLevel() 方法将压缩级别设置为最佳,以压缩文档中的内容。 您可以从 PdfCompressionLevel 枚举中选择其他一些级别。

  • 循环遍历文档中的页面,使用 PdfPageBase.getImagesInfo() 方法获取每个页面的图像信息集合。

  • 遍历集合中的所有项目,并使用 PdfBitmap.setQuality() 方法压缩特定图像的质量。

  • 使用 PdfPageBase.replaceImage() 方法将原始图像替换为压缩图像。使用 PdfDocument.saveToFile() 方法将文档保存到另一个 PDF 文件。

完整代码

Java
  1. import com.spire.pdf.PdfCompressionLevel;
  2. import com.spire.pdf.PdfDocument;
  3. import com.spire.pdf.PdfPageBase;
  4. import com.spire.pdf.exporting.PdfImageInfo;
  5. import com.spire.pdf.graphics.PdfBitmap;
  6. public class CompressPDFImage {
  7.     public static void main(String[] args) {
  8.         //创建 PdfDocument 类的对象。
  9.         PdfDocument doc = new PdfDocument();
  10.         //加载 PDF 文档
  11.         doc.loadFromFile("测试文档.pdf");
  12.         //将增量更新设置为false
  13.         doc.getFileInfo().setIncrementalUpdate(false);
  14.         //将压缩级别设置为最佳
  15.         doc.setCompressionLevel(PdfCompressionLevel.Best);
  16.         //循环遍历文档中的页面
  17.         for (int i = 0; i < doc.getPages().getCount(); i++) {
  18.             //获取特定页面
  19.             PdfPageBase page = doc.getPages().get(i);
  20.             //获取每个页面的图像信息集合
  21.             PdfImageInfo[] images = page.getImagesInfo();
  22.             //遍历集合中的项目
  23.             if (images != null && images.length > 0)
  24.                 for (int j = 0; j < images.length; j++) {
  25.                     //获取指定图像
  26.                     PdfImageInfo image = images[j];
  27.                     PdfBitmap bp = new PdfBitmap(image.getImage());
  28.                     //设置压缩质量
  29.                     bp.setQuality(20);
  30.                     //用压缩后的图片替换原始图片
  31.                     page.replaceImage(j, bp);
  32.                 }
  33.             //保存文件
  34.             doc.saveToFile("压缩PDF文档.pdf");
  35.             doc.close();
  36.         }
  37.     }
  38. }
复制代码
效果对比图


 
压缩 PDF 文档中的高分辨率图像

本方法仅对文档中的高分辨率图像进行无损压缩,而低分辨率的图像将不再被压缩。

  • 创建 PdfDocument 类的对象。
  • 使用 PdfDocument.loadFromFile() 方法加载 PDF 文档。
  • 使用 PdfDocument.getFileInfo().setIncrementalUpdate() 方法将 IncrementalUpdate 设置为 false。
  •  声明一个 PdfPageBase 变量。
  • 循环遍历页面并使用 PdfDocument.getPages().get() 方法获取特定页面。
  • 循环遍历页面中的图像。并使用 page.tryCompressImage(info.Index) 方法压缩高分辨率图像。
  • 使用 PdfDocument.saveToFile() 方法将文档保存到另一个 PDF 文件。
完整代码

Java
  1. import com.spire.pdf.PdfDocument;
  2. import com.spire.pdf.PdfPageBase;
  3. import com.spire.pdf.exporting.PdfImageInfo;
  4. public class CompressPDFImage {
  5.     public static void main(String[] args) {
  6.         //创建 PdfDocument 类的对象
  7.         PdfDocument doc = new PdfDocument
  8.         //加载 PDF 文档
  9.         doc.loadFromFile("示例文档.pdf");
  10.         //将IncrementalUpdate设置为false
  11.         doc.getFileInfo().setIncrementalUpdate(false);
  12.         //声明一个 PdfPageBase 变量
  13.         PdfPageBase page;
  14.         //循环遍历页面
  15.         for (int i = 0; i < doc.getPages().getCount(); i++) {
  16.             //获取指定页面
  17.             page = doc.getPages().get(i);
  18.             if (page != null) {
  19.                 if(page.getImagesInfo() != null){
  20.                     //循环遍历页面中的图像
  21.                     for (PdfImageInfo info: page.getImagesInfo()) {
  22.                         //使用tryCompressImage方法压缩高分辨率图像
  23.                         page.tryCompressImage(info.getIndex());
  24.                     }
  25.                 }
  26.             }
  27.         }
  28.         //保存文件
  29.         doc.saveToFile("输出结果.pdf");
  30.     }
  31. }
复制代码
效果对比图


—本文完—
 

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

tsx81428

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表