首页 > 解决方案 > 如何用python有效地替换word文档中的句子

问题描述

这是我到目前为止所做的:

from docx import Document

document = Document('filename.docx')

dic = {
    'Stack':'Stack Overflow',
'October 18 2021' : 'Actual Date'}
for p in document.paragraphs:
    inline = p.runs
    for i in range(len(inline)):
        text = inline[i].text
        for key in dic.keys():
            if key in text:
                 text=text.replace(key,dic[key])
                 inline[i].text = text


document.save('new.docx')

但是这个功能在她需要替换一个词的时候似乎很好用,但是当她需要替换句子时,它就不起作用了(这里是2021年10月18日)/

任何想法为什么句子不起作用?

标签: pythonpython-3.xdocxpython-docx

解决方案


问题在于您正在阅读的部分句子实际上是在不同的运行中。

正如scanny在这篇文章中所说:

因此,运行可以有效地在任意位置分解段落的文本,甚至每个字符运行一次。简而言之,Word 不会尝试跟踪句子。如果你看到一个跑步是一个纯粹巧合的句子。

解决此问题的一种简单方法是使用paragraph.text而不是进行搜索和替换inline.text

from docx import Document

document = Document('test.docx')

dic = {
    'Stack':'Stack Overflow',
    'October 18 2021' : 'Actual Date'
}
for p in document.paragraphs:
    for key in dic.keys():
        if key in p.text:
            p.text = p.text.replace(key,dic[key])

document.save('new.docx')

推荐阅读