首页 > 解决方案 > 使用python从.docx文件中的表中获取文本

问题描述

我需要将文档的全文作为 python 字符串。所以,我使用 docx 库:

doc = docx.Document(user_file)
fullText = []
for para in doc.paragraphs:
   fullText.append(para.text)
text = '\n'.join(fullText)

它有效,但忽略表格中的文本。我应该如何从表中获取数据?也许有什么方法可以清除标签或以某种方式准备文件?提前致谢!

标签: pythonpython-docx

解决方案


doc.tables按文档顺序返回与文档中的表对应的 Table 实例列表。请注意,只有出现在文档顶层的表格才会出现在此列表中;不会出现嵌套在表格单元格内的表格。<w:ins> 或 <w:del> 等修订标记内的表格也不会出现在列表中。


推荐阅读