最全总结 | 聊聊 Python 办公自动化之 Word(中)
聊聊 Python 数据处理全家桶(Memca 篇) 点击上方“ AirPython ”,选择“ 加为星标 ” 第一时间关注 Python 技术干货! 1. 前言 上一篇文章,对 Word 写入数据的一些常见操作进行了总结 最全总结 | 聊聊 Python 办公自动化之 Word(上) 相比写入数据,读取数据同样很实用! 本篇文章,将谈谈如何全面读取一个 Word 文档中的数据,并会指出一些要注意的点 2. 基本信息 我们同样使用 python-docx 这个依赖库来对 Word 文档进行读取 首先我们来读取文档的基本信息 它们分别是: 章节、页边距、页眉页脚边距、页面宽高、页面 方向等 在获取文档基础信息之前,我们通过文档路径构建一个文档对象 Document from docx import Document # 源文件目录 self.word_path = './output.docx' # 打开文档,构建一个文档对象 self.doc = Document(self.word_path) 1 - 章节( Section ) # 1、获取章节信息 # 注意:章节可以设置本页的大小、页眉、页脚 msg_sections = self.doc.sections print( "章节列表:" , msg_sections) # 章节数目 print( '章节数目:' , len