python - doxc 样式列表段落
问题描述
我有一堆 docx 文档,我正在使用 python-docx 提取文本。提取效果很好。但是,我无法掌握段落的编号。
一个word文档可以是:
- 一些标题:这是第一段。
- 第二页眉:这是第二段。
我正在遍历这样的段落:
print(paragraph.text)
print(paragraph.style)
print(paragraph._p.pPr.numPr.numId.val)
它将段落样式打印为
_ParagraphStyle('List Paragraph') id: 2280433126816
这很好。它还可以正确打印文本。
但是,它总是打印 1
print(paragraph._p.pPr.numPr.numId.val)
解决方案
推荐阅读
- python - 如果它们包含给定的短语,则删除python中字符串列表的所有元素
- sql - 使用带有窗口函数的递归 CTE
- makefile - 传递要在 MAKEFLAGS 中扩展的变量
- rust - 如何在 Rust 中开发词典?
- google-apps-script - 无法在电子表格上创建可安装触发器
- python-3.x - RobotFramework:在 For 循环中使用变量列表
- c# - 为什么 sonarlint 建议结合 try...catch 语句?
- amazon-web-services - 如何更改 API Gateway 响应
- php - 如何使用 PHP 将文件池图像上传到 MySql?
- xml - 如何使用 Postman 可视化 XML SOAP 信封