首页 > 解决方案 > 除非复制和粘贴字符串,否则 Python 正则表达式不匹配

问题描述

import re
from docx import Document
file1=""

document = Document(filename)    
for p in document.paragraphs:
    file1=(file1 + p.text)
print(file1)

pattern=r"""B.*?A"""
searchObj=re.search(pattern, file1, re.M|re.I)

if searchObj:
    print("\n" + searchObj.group())        
else:
    print("\n No match")

File1 本质上是:...B...A...

使用 docx 读取 Word .DOCX 文件。它的内容存储在一个字符串中。然后尝试在该字符串中查找特定模式。尝试失败(不匹配),除非您从命令窗口复制并粘贴确切的字符串(例如,如果您在 Python 脚本中键入 A 则不匹配,但如果您将 A 从 CMD 复制并粘贴到 Python 脚本中,则匹配成功)。

任何帮助将不胜感激。

标签: pythonregexdocx

解决方案


推荐阅读