金歌 发表于 2025-1-4 08:51:47

用Python的PyWin32库,一键主动化Word文档处理处罚!

https://i-blog.csdnimg.cn/direct/e03b73ef10be47f0a4b73018c02e471b.gif#pic_center
   你好,我是忆~遂愿,全网4w+粉丝,《遂愿盈创》社群主理人。
副业动身① | 遂愿盈创(对副业感兴趣免费可入,多种赢利实战项目等你来,一起探寻副业快速变现的途径;以及对接互联网大厂商务互助,一起来搞点小外快,认识更多互联网大咖)
目前群里已经带很多小伙伴(大部分大学生)变现几百块啦,程序员搞副业有额外加成~ 对副业感兴趣可+V : suiyuan2ying 拉你进群。
办公主动化是每个程序员都绕不开的话题。写代码归写代码,可文档工作还是要做的。
本日咱就聊聊怎么用Python来处理处罚Word文档,让枯燥的文档工作变得轻松又风趣。
PyWin32这个库简直就是Office主动化的神器,它能让Python直接调用Word的各种功能,就像你手动操作Word一样。
安装设置

在开始之前得先把环境搭起来,装个PyWin32库:
pip install pywin32
装完之后导入需要的模块:
import win32com.client as win32
import os
温馨提示:有些小伙伴可能会碰到安装失败的情况,多半是因为Python版本不匹配。
建议利用Python 3.6以上的版本,实在装不上可以试试用管理员权限运行命令行。
创建Word文档

先来个简单的,创建一个新文档:
word = win32.Dispatch('Word.Application')
word.Visible = True# 这句可以让Word窗口显示出来
doc = word.Documents.Add()
这里的word.Visible = True实在是可选的。要是设成False,Word就会在后台运行,界面上看不到。
不外我建议在开发调试的时间设成True,如许能直观地看到代码在对文档做什么操作。
写入和格式化文本

往文档里加点内容,顺便整点格式:
selection = word.Selection
selection.TypeText('Python自动化办公真香!\n')
selection.Font.Size = 16
selection.Font.Bold = True

# 换个段落
selection.TypeParagraph()
selection.TypeText('这段文字是普通大小的~')
selection.Font.Size = 12
selection.Font.Bold = False

# 添加一些花里胡哨的格式
selection.TypeParagraph()
text = selection.Range
text.Text = "来点彩色的文字"
text.Font.Color = 255# 红色
text.Font.Name = "微软雅黑"
text.Font.Italic = True
玩转表格

表格必须得整一个,这可是文档里的重头戏:
table = doc.Tables.Add(selection.Range, 3, 3)# 3行3列的表格
table.Borders.Enable = True# 显示表格边框

# 填充表格内容
table.Cell(1,1).Range.Text = "第一行第一列"
table.Cell(1,2).Range.Text = "第一行第二列"
table.Cell(1,3).Range.Text = "第一行第三列"

# 设置表格样式
table.Style = "网格型"
table.Rows(1).Shading.BackgroundPatternColor = 255# 第一行背景设为红色
表格还能归并单位格、调整列宽、设置对齐方式:
# 合并单元格
table.Cell(2,1).Merge(table.Cell(2,2))

# 调整列宽
table.Columns(1).Width = 100

# 设置对齐方式
table.Cell(1,1).Range.ParagraphFormat.Alignment = 1# 1是居中对齐
插入图片和形状

文档里不能光有字,得来点图片和形状粉饰一下:
# 插入图片
selection.TypeParagraph()
pic = selection.InlineShapes.AddPicture(os.path.abspath("test.jpg"))
pic.Width = 200# 调整图片大小
pic.Height = 150

# 插入形状
shape = doc.Shapes.AddShape(1, 100, 100, 100, 100)# 类型、左边距、上边距、宽度、高度
shape.Fill.ForeColor.RGB = (255, 0, 0)# 设置填充颜色
shape.Line.ForeColor.RGB = (0, 0, 255)# 设置边框颜色
页面设置和页眉页脚

整个文档的格式也得讲究:
# 页面设置
doc.PageSetup.TopMargin = 72# 上边距(72磅 = 1英寸)
doc.PageSetup.BottomMargin = 72
doc.PageSetup.LeftMargin = 72
doc.PageSetup.RightMargin = 72
doc.PageSetup.Orientation = 1# 1是纵向,0是横向

# 添加页眉
header = doc.Sections(1).Headers(1)
header.Range.Text = "这是页眉"
header.Range.Font.Size = 12
header.Range.ParagraphFormat.Alignment = 1# 居中对齐

# 添加页脚
footer = doc.Sections(1).Footers(1)
footer.Range.Text = "第 "
footer.Range.Fields.Add(footer.Range, -1, "PAGE")# 插入页码
批量处理处罚文档

要是有一堆文档要处理处罚,可以整个循环,还能加上进度提示:
def process_docs(folder_path):
    word = win32.Dispatch('Word.Application')
    files =
    total = len(files)
   
    for idx, filename in enumerate(files, 1):
      print(f'正在处理: {filename} ({idx}/{total})')
      try:
            doc = word.Documents.Open(os.path.join(folder_path, filename))
            # 在这里写处理文档的代码
            doc.Save()
            doc.Close()
      except Exception as e:
            print(f'处理文件 {filename} 时出错: {str(e)}')
   
    word.Quit()
实用小本领


[*]逼迫关闭Word进程:
import os
def kill_word_process():
    os.system('taskkill /f /im WINWORD.EXE')

[*]异常处理处罚和主动重试:
import time
def retry_on_error(func, max_attempts=3):
    for attempt in range(max_attempts):
      try:
            return func()
      except Exception as e:
            if attempt == max_attempts - 1:
                raise e
            print(f'操作失败,{attempt + 1}秒后重试...')
            time.sleep(attempt + 1)

[*]文档另存为PDF:
def save_as_pdf(doc, pdf_path):
    try:
      doc.SaveAs(pdf_path, FileFormat=17)# 17是PDF格式
    except Exception as e:
      print(f'转换PDF失败: {str(e)}')

[*]查找和替换文本:
def find_and_replace(doc, find_text, replace_text):
    word_range = doc.Content
    word_range.Find.Execute(
      FindText=find_text,
      ReplaceWith=replace_text,
      Replace=2# 2表示全部替换
    )
温馨提示:在处理处罚大量文档时,记得定期保存,还要做好异常处理处罚。要是处理处罚到一半断电大概程序崩溃,至少不会半途而废。
性能优化小贴士

处理处罚大量文档时,可以关闭一些Word的主动功能来提拔性能:
def optimize_word_settings(word):
    word.DisplayAlerts = False# 关闭警告提示
    word.ScreenUpdating = False# 关闭屏幕刷新
    word.EnableAnimations = False# 关闭动画效果
   
def restore_word_settings(word):
    word.DisplayAlerts = True
    word.ScreenUpdating = True
    word.EnableAnimations = True
PyWin32真是个宝藏库,用它处理处罚文档既省时又省力。
不外写代码的时间得多测试,究竟主动化操作一个不小心可能会搞丢文档内容。
建议每次运行前都备份一下重要文件,否则哭都没地方哭。
代码写完了,文档主动生成了,这下可以摸鱼了~不是,是可以去做更有意义的事变了!
对了,要是以为PyWin32用起来还不敷顺手,还可以试试python-docx这个库,不外那就是另一个故事了。
末了提一句,对副业感兴趣可以看下方的微信二维码~

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 用Python的PyWin32库,一键主动化Word文档处理处罚!