Java 将HTML转为XML

打印 上一主题 下一主题

主题 865|帖子 865|积分 2595

本文介绍如何通过Java后端程序代码来展示如何将html转为XML。此功能通过采用Word API- Free Spire.Doc for Java 提供的Document.saveToFile()方法来实现;该方法支持的目标文档格式多达 30余种。另外,该API也提供了多种方法,如Document.saveToEpub()Document.saveToFile()Document.saveToImages()Document.saveToSVG()Document.saveToTxt()、Document.saveToTiff()等,可用于将源文件转为Epub、图片、文本文件等目标文档格式。

下面,将以html转为xml格式为例,介绍如何实现转换。以下是详细方法及步骤。
【关于如何导入jar包】

通过 Maven仓库 下载导入,如下配置pom.xml:
  1. <repositories>
  2.     <repository>
  3.         <id>com.e-iceblue</id>
  4.         <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
  5.     </repository>
  6. </repositories>
  7. <dependencies>
  8.     <dependency>
  9.         <groupId>e-iceblue</groupId>
  10.         <artifactId>spire.doc.free</artifactId>
  11.         <version>5.2.0</version>
  12.     </dependency>
  13. </dependencies>
复制代码
如需手动导入,需要下载 jar包 到本地,然后解压,找到lib文件夹下的Spire.Doc.jar文件。在IDEA中打开“Project Structure”界面,执行如图步骤将本地路径下的jar文件手动引入Java程序:

 

【将 HTML 转为 XML

转换时,可参考如下代码步骤:

  • 创建Document类的对象。
  • 调用Document.loadFromFile(String fileName, FileFormat fileFormat)方法加载HTML文件。
  • 通过Document.saveToFile(String fileName, FileFormat fileFormat)方法保存为XML格式到指定路径。
Java
  1. import com.spire.doc.*;
  2. public class HTMLtoXML {
  3.     public static void main(String[] args) {
  4.         //创建Document类的对象
  5.         Document doc = new Document();
  6.         //加载html文件
  7.         doc.loadFromFile("sample.html",FileFormat.Html);
  8.         //保存为XML格式
  9.         doc.saveToFile("HTMLtoXML.xml", FileFormat.Xml);
  10.     }
  11. }
复制代码
转换效果:

 
—END—
 

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

冬雨财经

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表