C# 将PDF文档转换为Markdown文档

打印 上一主题 下一主题

主题 970|帖子 970|积分 2910

将PDF文件转换为Markdown格式是一个非常实用的需求,尤其是在需要将内容从固定布局的PDF文件中提取出来,并转换为更易于编辑和处理的文本格式时。本文将介绍怎样通过C#代码将PDF文档转换Markdown(MD)文档。
 
需要用到第三方库 Spire.PDF for .NET。可以从以下链接下载产品包后手动添加引用,或者直接通过NuGet安装。
https://www.e-iceblue.cn/Downloads/Spire-PDF-NET.html
 
C# 将PDF转为Markdown文档

步调:

  • 创建 PdfDocument 类的对象
  • 通过 LoadFromFile() 方法加载PDF文档;
  • 通过 SaveToFile(string filename, FileFormat.Markdown) 将加载的PDF文档转换为markdown文档。
示例代码:
  1. using Spire.Pdf;
  2. namespace PDFToMarkdown
  3. {
  4.     class Program
  5.     {
  6.         static void Main(string[] args)
  7.         {
  8.             //加载PDF文档
  9.             PdfDocument pdf = new PdfDocument();
  10.             pdf.LoadFromFile("测试.pdf");
  11.             //将PDF转换为MD文档
  12.             pdf.SaveToFile("PDF转Markdown.md", FileFormat.Markdown);
  13.             pdf.Close();
  14.         }
  15.     }
  16. }
复制代码

 
该Spire.PDF for .NET库支持多种在.NET 程序创建、读取、转换、打印PDF文档的操纵,更多示例可以参考:
https://www.e-iceblue.cn/spirepdfnet/spire-pdf-for-net-program-guide-content.html
 
对于生成文档中的水印,点击申请临时授权移除并完整试用:
https://www.e-iceblue.cn/misc/temporary-license.html



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

水军大提督

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表