首页 > 解决方案 > doxc 样式列表段落

问题描述

我有一堆 docx 文档,我正在使用 python-docx 提取文本。提取效果很好。但是,我无法掌握段落的编号。

一个word文档可以是:

  1. 一些标题:这是第一段。
  2. 第二页眉:这是第二段。

我正在遍历这样的段落:

print(paragraph.text)
print(paragraph.style)
print(paragraph._p.pPr.numPr.numId.val)

它将段落样式打印为

_ParagraphStyle('List Paragraph') id: 2280433126816

这很好。它还可以正确打印文本。

但是,它总是打印 1

print(paragraph._p.pPr.numPr.numId.val)

标签: pythonpython-docx

解决方案


推荐阅读