首页 > 解决方案 > 使用任何 Python 的正则表达式模式在文档中查找内容时遇到问题

问题描述

我有一个我想在某些文档中找到的正则表达式列表。

x = ['\bin\sapp\sdata\b','\bin\sapp\sdata\b','\benough\sdata\b']

模式会重复自己,所以我将它们转换为一组(请参阅列表中的第一个和第二个值)

y = set(x)

当我尝试在特定文档中找到它们时,它没有找到它们,因为它不将它们作为 repr 版本:

import pandas as pd
import re

results = list()
doc = 'they wanted in app data and we did not provide it'
for value in y:
    results.append(re.findall(pattern = value,string=doc))
results = list(filter(None, results))
results

我该如何克服呢?

谢谢

标签: python-3.xregexre

解决方案


问题出在 python 3.7 版本上。我得到的错误是“位置 0 处的错误转义 \l”一旦我将 re 更改为正则表达式,它工作得非常好,即使“编码混乱”


推荐阅读