python - 使用 Python-Docx 从特定 Docx 文件中提取内容
问题描述
我正在将Python-Docx库用于从 Word 文档中提取文本、标题和图像的项目。但是,我不想从 word 文档的每一页中提取这个,我只想要前 3 页中的这个内容。如果有人可以为以下内容编写示例代码:
- 加载 Word 文档文件。
- 搜索任何标题、文本或图像。
- 仅搜索文档的前 3 页。
- 获取找到的标题、文本和图像,并使用 Python-Docx 将它们附加到新文档中。
解决方案
推荐阅读
- java - 在java中使用Arrays.sort对二维数组进行排序
- indexing - Janusgraph 未在生产中使用索引
- python - 为什么 word2vec 创建词嵌入的速度如此之快?
- python - Pandas - 使用第二行作为标题并将第一行保留在数据框中
- java - 在spring-data-jdbc中使用一对一关系时如何插入相关实体的id(自动递增)?
- javascript - 引导卡的问题是打开所有未在 vue js 中单击的折叠
- amazon-web-services - Cloudformation YAML 模板如果没有按预期工作
- c++ - 立即函数作为 Clang++ 中的默认函数参数初始化器
- sql - 在 spark-sql 中拆分电子邮件地址
- rust - 如何通过格式显示多行 Display impl!宏?