你好,我是忆~遂愿,全网4w+粉丝,《遂愿盈创》社群主理人。
副业动身① | 遂愿盈创(对副业感兴趣免费可入,多种赢利实战项目等你来,一起探寻副业快速变现的途径;以及对接互联网大厂商务互助,一起来搞点小外快,认识更多互联网大咖)
目前群里已经带很多小伙伴(大部分大学生)变现几百块啦,程序员搞副业有额外加成~ 对副业感兴趣可+V : suiyuan2ying 拉你进群。
办公主动化是每个程序员都绕不开的话题。写代码归写代码,可文档工作还是要做的。
本日咱就聊聊怎么用Python来处理处罚Word文档,让枯燥的文档工作变得轻松又风趣。
PyWin32这个库简直就是Office主动化的神器,它能让Python直接调用Word的各种功能,就像你手动操作Word一样。
安装设置
在开始之前得先把环境搭起来,装个PyWin32库:
装完之后导入需要的模块:
- import win32com.client as win32
- import os
复制代码 温馨提示:有些小伙伴可能会碰到安装失败的情况,多半是因为Python版本不匹配。
建议利用Python 3.6以上的版本,实在装不上可以试试用管理员权限运行命令行。
创建Word文档
先来个简单的,创建一个新文档:
- word = win32.Dispatch('Word.Application')
- word.Visible = True # 这句可以让Word窗口显示出来
- doc = word.Documents.Add()
复制代码 这里的word.Visible = True实在是可选的。要是设成False,Word就会在后台运行,界面上看不到。
不外我建议在开发调试的时间设成True,如许能直观地看到代码在对文档做什么操作。
写入和格式化文本
往文档里加点内容,顺便整点格式:
- selection = word.Selection
- selection.TypeText('Python自动化办公真香!\n')
- selection.Font.Size = 16
- selection.Font.Bold = True
- # 换个段落
- selection.TypeParagraph()
- selection.TypeText('这段文字是普通大小的~')
- selection.Font.Size = 12
- selection.Font.Bold = False
- # 添加一些花里胡哨的格式
- selection.TypeParagraph()
- text = selection.Range
- text.Text = "来点彩色的文字"
- text.Font.Color = 255 # 红色
- text.Font.Name = "微软雅黑"
- text.Font.Italic = True
复制代码 玩转表格
表格必须得整一个,这可是文档里的重头戏:
- table = doc.Tables.Add(selection.Range, 3, 3) # 3行3列的表格
- table.Borders.Enable = True # 显示表格边框
- # 填充表格内容
- table.Cell(1,1).Range.Text = "第一行第一列"
- table.Cell(1,2).Range.Text = "第一行第二列"
- table.Cell(1,3).Range.Text = "第一行第三列"
- # 设置表格样式
- table.Style = "网格型"
- table.Rows(1).Shading.BackgroundPatternColor = 255 # 第一行背景设为红色
复制代码 表格还能归并单位格、调整列宽、设置对齐方式:
- # 合并单元格
- table.Cell(2,1).Merge(table.Cell(2,2))
- # 调整列宽
- table.Columns(1).Width = 100
- # 设置对齐方式
- table.Cell(1,1).Range.ParagraphFormat.Alignment = 1 # 1是居中对齐
复制代码 插入图片和形状
文档里不能光有字,得来点图片和形状粉饰一下:
- # 插入图片
- selection.TypeParagraph()
- pic = selection.InlineShapes.AddPicture(os.path.abspath("test.jpg"))
- pic.Width = 200 # 调整图片大小
- pic.Height = 150
- # 插入形状
- shape = doc.Shapes.AddShape(1, 100, 100, 100, 100) # 类型、左边距、上边距、宽度、高度
- shape.Fill.ForeColor.RGB = (255, 0, 0) # 设置填充颜色
- shape.Line.ForeColor.RGB = (0, 0, 255) # 设置边框颜色
复制代码 页面设置和页眉页脚
整个文档的格式也得讲究:
- # 页面设置
- doc.PageSetup.TopMargin = 72 # 上边距(72磅 = 1英寸)
- doc.PageSetup.BottomMargin = 72
- doc.PageSetup.LeftMargin = 72
- doc.PageSetup.RightMargin = 72
- doc.PageSetup.Orientation = 1 # 1是纵向,0是横向
- # 添加页眉
- header = doc.Sections(1).Headers(1)
- header.Range.Text = "这是页眉"
- header.Range.Font.Size = 12
- header.Range.ParagraphFormat.Alignment = 1 # 居中对齐
- # 添加页脚
- footer = doc.Sections(1).Footers(1)
- footer.Range.Text = "第 "
- footer.Range.Fields.Add(footer.Range, -1, "PAGE") # 插入页码
复制代码 批量处理处罚文档
要是有一堆文档要处理处罚,可以整个循环,还能加上进度提示:
- def process_docs(folder_path):
- word = win32.Dispatch('Word.Application')
- files = [f for f in os.listdir(folder_path) if f.endswith('.docx')]
- total = len(files)
-
- for idx, filename in enumerate(files, 1):
- print(f'正在处理: {filename} ({idx}/{total})')
- try:
- doc = word.Documents.Open(os.path.join(folder_path, filename))
- # 在这里写处理文档的代码
- doc.Save()
- doc.Close()
- except Exception as e:
- print(f'处理文件 {filename} 时出错: {str(e)}')
-
- word.Quit()
复制代码 实用小本领
- import os
- def kill_word_process():
- os.system('taskkill /f /im WINWORD.EXE')
复制代码- import time
- def retry_on_error(func, max_attempts=3):
- for attempt in range(max_attempts):
- try:
- return func()
- except Exception as e:
- if attempt == max_attempts - 1:
- raise e
- print(f'操作失败,{attempt + 1}秒后重试...')
- time.sleep(attempt + 1)
复制代码- def save_as_pdf(doc, pdf_path):
- try:
- doc.SaveAs(pdf_path, FileFormat=17) # 17是PDF格式
- except Exception as e:
- print(f'转换PDF失败: {str(e)}')
复制代码- def find_and_replace(doc, find_text, replace_text):
- word_range = doc.Content
- word_range.Find.Execute(
- FindText=find_text,
- ReplaceWith=replace_text,
- Replace=2 # 2表示全部替换
- )
复制代码 温馨提示:在处理处罚大量文档时,记得定期保存,还要做好异常处理处罚。要是处理处罚到一半断电大概程序崩溃,至少不会半途而废。
性能优化小贴士
处理处罚大量文档时,可以关闭一些Word的主动功能来提拔性能:
- def optimize_word_settings(word):
- word.DisplayAlerts = False # 关闭警告提示
- word.ScreenUpdating = False # 关闭屏幕刷新
- word.EnableAnimations = False # 关闭动画效果
-
- def restore_word_settings(word):
- word.DisplayAlerts = True
- word.ScreenUpdating = True
- word.EnableAnimations = True
复制代码 PyWin32真是个宝藏库,用它处理处罚文档既省时又省力。
不外写代码的时间得多测试,究竟主动化操作一个不小心可能会搞丢文档内容。
建议每次运行前都备份一下重要文件,否则哭都没地方哭。
代码写完了,文档主动生成了,这下可以摸鱼了~不是,是可以去做更有意义的事变了!
对了,要是以为PyWin32用起来还不敷顺手,还可以试试python-docx这个库,不外那就是另一个故事了。
末了提一句,对副业感兴趣可以看下方的微信二维码~
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |