python - 如何使用 Python 分析 docx 文件中的注释语句?
问题描述
我目前正在使用 Python-docx 包并已处理文本和评论。但是,在 .docx 文件中,每条评论都针对特定的句子或段落。我想知道如何通过 Python-docx 阅读评论和句子之间的这种链接。或者我应该使用另一个包?
谢谢!
更新抱歉不清楚。这是一个例子。每条评论都链接到一个句子。我的目标是提取评论和句子之间的配对信息。 对话示例
解决方案
您的问题有点含糊,但据我所知,您想将分配给句子或段落的评论(可能是对其进行评论)相互配对吗?
您可以通过多种方式做到这一点,但仅举几例,如果句子/段落只有一个评论,那么您可以将评论与其在字典中的句子配对。然后,您可以轻松地打印所有对,或者循环遍历并分别打印。
您还可以使用诸如 openpyxl 之类的模块将评论和句子分配给 excel 文档,将句子放在一列中,将评论放在另一列中。
您还可以使用您正在使用的 Python-docx 包将评论及其响应的句子/段落简单地写入另一个 word 文档。
我强烈建议至少阅读第 13 章自动化无聊的东西——它可以在线免费获得——并且用非常清晰的例子回答你的问题做得很好。我会提供链接,但模组不喜欢这里的链接。
推荐阅读
- terraform - 无法使用 terraform0.11 传递元素列表
- swift - Stripe IOS SDK刷卡后如何找回刷卡方式
- java - VSCode Kotlin Spring 错误:未解决的参考
- python - 如何使用美丽的汤选择一个类词
- java - 非静态等效于 java.nio.file.Paths.get()
- sentiment-analysis - 情感分析 TextBlob 中的主观性和极性
- rust - 在不移动数据的情况下为枚举实现 Add trait
- mongodb - 为什么 MongoDb Atlas UI 不允许我插入对象数组?
- php - 注销后仍然可以访问基于 php 会话的页面
- sql-server - sys.objects modify_date 是检查表在 SQL Server 中修改的最后时间的可靠方法吗?