Java 根据模板导出PDF
目录[*]前言
[*]思路一:直接导出pdf
[*]使用itext模板导出pdf
[*]思路二:先导出word再转成pdf
[*]1)导出word
[*]2)word转pdf
[*]最终方案
[*]docx4jspire.doc.free + freemarker
前言
本文为我搜集的根据模板导出PDF的方法整理而来,所以贴了好多帖子的链接。有的方法仅适合特殊的业务场景,可以根据业务需求选择合适的方法。写的不好请轻喷。
思路一:直接导出pdf
使用itext模板导出pdf
[*]适用范围
业务生成的 pdf 是具有固定格式或者模板的文字及其图片等内容,使用模板,只需要将不一致的地方改成文本域,然后进行文字填充就可以了;如果涉及的业务不能有模块化可以提取出来东西,从开头一步一步去绘画。
[*]参考链接
JAVA 使用Itext模板生成pdf,解决图片插入,文本域超出字体缩放,半自动换行
java根据模板生成pdf文件并导出
[*]缺点
超出文本域的部分的文字(若不设置自动调整文字大小)则会不显示,无法自动分页。(暂未找到解决方案)
思路二:先导出word再转成pdf
1)导出word
[*]Freemarker
官方参考手册:http://freemarker.foofun.cn/toc.html
[*]Freemarker 将数据填入 .ftl 模板导出 word(.doc/.docx)
[*]参考链接:
SpringBoot整合Freemarker导出word文档表格
freemarker导出Word,文本,可循环表格,合并单元格,可循环图片,目录更新(一)
[*]缺点:
导出的 .doc / .docx 实际上是 xml 文件,用办公软件能正常打开使用。但是转 PDF 的时候发现转不成功。转过之后的 PDF 显示的不是 word 的格式字符,而是像 xml 文件的标签及字符。
[*]Freemarker 结合 .docx 格式的本质将数据填入 .docx 里面的 document.xml 文件导出 .docx
[*]参考链接:
freemarker动态生成word并将生成的word转为PDF
[*]优点:
可转换为 pdf
[*]相关错误:
A. Date 格式的数据传输报错!
解决方案:
${(initialTime?string("yyyy-MM-dd HH:mm:ss"))!}
[*]附:
a. 循环行及表单行是否显示功能参考链接:
SpringBoot整合Freemarker导出word文档表格
freemarker合并单元格,if、else标签的使用,null、空字符串处理
如:
https://img2023.cnblogs.com/blog/2490821/202303/2490821-20230302105100043-1700695864.png
导出结果如下:
https://img2023.cnblogs.com/blog/2490821/202303/2490821-20230302105109153-443205517.png
也可向参考链接2一样,在 xml 上定义插入对应的合并代码(如下图)。
https://img2023.cnblogs.com/blog/2490821/202303/2490821-20230302105119928-1107859293.png
[*]docx4j
结合 .docx 格式的本质将数据填入 .docx 里面的 document.xml 文件导出 .docx
docx4j 中模板的使用
docx4j 实现动态表格(模板式)
docx4j 中图片的使用(模板式)
docx4j 实现动态表格(模板式)单元格合并(含多列并列合并)
[*]POI
Poi的导出word和转pdf --已试过,可行
Java文件操作之word转pdf并导出(liunx和windows)
[*]Aspose.word(需要license)(未尝试)
使用Aspose.word (Java) 填充word文档数据(包含图片填充)
2)word转pdf
[*]docx4j 将 .docx 转 pdf
官方下载地址
[*]方法一:使用 docx4j2.8.1在 docx 模板填入数据并且转 pdf
参考链接:docx4j Word文档转换pdf- 解决中文问题和变量替换
[*]方法二:将 docx 转 pdf
参考链接:freemarker动态生成word并将生成的word转为PDF
[*]相关错误:
A.导出的 PDF 乱码(检查 word 文件中的字体是否在字体库中)
使用docx4j实现docx转pdf(解决linux环境下中文乱码问题)
https://img2023.cnblogs.com/blog/2490821/202303/2490821-20230302105153972-294056041.png
B.注意:存在样式 bug!!!
暂未找到解决方案。
[*]Spire.Doc 实现 word (.doc / .docx)转 pdf(尝试了免费版,可行)
有付费版和免费版,免费版仅支持三页内的 word 转 pdf
[*]aspose.word 将 word 转 pdf (未尝试)
需要license,破解方法1,破解方法2
最终方案
docx4jspire.doc.free + freemarker
<ol>模板准备
将占位变量名写在模板 testTemplate.docx的对应位置上,用 ${}包起来。
https://img2023.cnblogs.com/blog/2490821/202303/2490821-20230302105210929-81066711.png
把复制一份副本,将副本 .docx 的后缀名重命名为 .zip。解压后找到 /word/document.xml,编译器打开文件,代码格式化后,对比例如 ${repliedUserId} 的占位参数是否被拆开(如果拆开需手动修改),修改名字为 testDocument.xml。
将源模板 testTemplate.docx 和 testDocument.xml 放到相应位置。
maven依赖
<dependencies>
<dependency>
<groupId>org.freemarker</groupId>
<artifactId>freemarker</artifactId>
<version>2.3.22</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-Internal</artifactId>
<version>8.2.4</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-export-fo</artifactId>
<version>8.2.4</version>
</dependency>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.doc.free</artifactId>
<version>5.2.0</version>
</dependency>
</dependencies>
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>Controller
@PostMapping("/pdfExport")
public ResponseEntity exportPdf(@RequestParam Map<String, Object> params) {
try {
// 查找业务数据
TestEntity testEntity = testService.querySheet(params);
// 格式转换时的暂存文件名
String fileUuid = UUID.randomUUID().toString().replaceAll("-", "");
String toDocxPath = "E://project//test//ToPDF//word//" + fileUuid + ".docx";
String toPdfPath = "E://project//test//ToPDF//pdf//" + fileUuid + ".pdf";
String toXmlPath = "E://project//test//ToPDF//xml//" + fileUuid + ".xml";
String docxTemplate = "E://project//test//ToPDF//template//testTemplate.docx";
// .xml转.docx(testDocument.xml表示在项目的相对路径下)
XmlToDocx.toDocx("testDocument.xml",docxTemplate, toXmlPath, toDocxPath, testEntity);
// .docx转.pdf
WordToPdf.docxToPdf(toDocxPath, toPdfPath);
// 下载pdf并删除本地pdf
ResponseEntity response = WordToPdf.downloadPdf("这是PDF的名字啊", toPdfPath);
return response;
} catch (Exception e) {
throw new BusinessException("下载PDF失败!" + e.getMessage());
}
}XmlToDocx类
import java.io.*;import java.util.Enumeration;import java.util.Map;import java.util.zip.ZipEntry;import java.util.zip.ZipException;import java.util.zip.ZipFile;import java.util.zip.ZipOutputStream;/** * 其实docx属于zip的一种,这里只需要操作word/document.xml中的数据,其他的数据不用动 * * @author * */public class XmlToDocx { /** * * @param xmlTemplate xml的文件名 * @param docxTemplate docx的路径和文件名(.docx模板) * @param xmlTemp填充完数据的临时xml * @param toFilePath目标文件名 * @param object需要动态传入的数据 */ public static void toDocx(String xmlTemplate, String docxTemplate, String xmlTemp, String toFilePath, Object object){ try { // 1.object是动态传入的数据 // 这个地方不能使用FileWriter因为需要指定编码类型否则生成的Word文档会因为有无法识别的编码而无法打开// Writer w1 = new OutputStreamWriter(new FileOutputStream(xmlTemp), "gb2312"); Writer w1 = new OutputStreamWriter(new FileOutputStream(xmlTemp), "utf-8"); // 2.把object中的数据动态由freemarker传给xml XmlTplUtil.process(xmlTemplate, object, w1); // 3.把填充完成的xml写入到docx中 XmlToDocx xtd = new XmlToDocx(); File xmlTempFile = new File(xmlTemp); xtd.outDocx(xmlTempFile, docxTemplate, toFilePath); // 删除临时xml文件 xmlTempFile.delete(); }catch (Exception e) { e.printStackTrace(); } } /** * * @param documentFile 动态生成数据的docunment.xml文件 * @param docxTemplate docx的模板 * @param toFilePath需要导出的文件路径 * @throws ZipException * @throws IOException */ public void outDocx(File documentFile, String docxTemplate, String toFilePath) throws ZipException, IOException { try { File docxFile = new File(docxTemplate); ZipFile zipFile = new ZipFile(docxFile); Enumeration
页:
[1]