python - 如何用python有效地替换word文档中的句子
问题描述
这是我到目前为止所做的:
from docx import Document
document = Document('filename.docx')
dic = {
'Stack':'Stack Overflow',
'October 18 2021' : 'Actual Date'}
for p in document.paragraphs:
inline = p.runs
for i in range(len(inline)):
text = inline[i].text
for key in dic.keys():
if key in text:
text=text.replace(key,dic[key])
inline[i].text = text
document.save('new.docx')
但是这个功能在她需要替换一个词的时候似乎很好用,但是当她需要替换句子时,它就不起作用了(这里是2021年10月18日)/
任何想法为什么句子不起作用?
解决方案
问题在于您正在阅读的部分句子实际上是在不同的运行中。
正如scanny在这篇文章中所说:
因此,运行可以有效地在任意位置分解段落的文本,甚至每个字符运行一次。简而言之,Word 不会尝试跟踪句子。如果你看到一个跑步是一个纯粹巧合的句子。
解决此问题的一种简单方法是使用paragraph.text
而不是进行搜索和替换inline.text
from docx import Document
document = Document('test.docx')
dic = {
'Stack':'Stack Overflow',
'October 18 2021' : 'Actual Date'
}
for p in document.paragraphs:
for key in dic.keys():
if key in p.text:
p.text = p.text.replace(key,dic[key])
document.save('new.docx')
推荐阅读
- html - HTML 和 CSS 弹性盒
- python - 在一个窗口中重复交替显示两个图像
- angular - 如何过滤数组并返回整个对象 - Angular
- javascript - 井字游戏中的单人游戏模式
- linkedin-api - 在 Linkedin API 中获取 AudienceCountsV2 时收到 400 Bad request
- visual-studio-code - Visual Studio Code 在控制点击时不再跳转到终端中的错误
- mysql - 使用 SQL 中的条件从 3 个不同的表中获取记录
- ios - xcode 错误,将重构的故事板添加到新组时崩溃
- google-cloud-platform - gcloud 计算相同的实例数据未显示
- css - css选择器和jQuery组合的问题