首页 > 解决方案 > 与 findall() 一起使用的正则表达式模式来定位 3 个字母的单词

问题描述

所以我有一些代码可以产生正确的结果,但是代码太具体了。我希望它更通用,以便我可以使用 re.findall() 从“s2”中提取所有 3 个字母的单词(例如 DOG)。

在下面的代码中,问题是当我打印 m[0:3] 时,我正在挑选三个字母单词的三个单词。换句话说,我的代码查找 3+ 个字母的单词,我必须挑选,而我只想要 3 个字母的单词——从一开始就没有更多,也没有更少。

list2 = 'A, k: it; hi! map@ LAP# rAp, home: LIFE; party! animals@'
m = re.findall(r'(\w{3,})', list2) 
m[0:3]

我想得到 ['map', 'lap', 'rAP']。而且我希望代码将来能够保留任何其他 3 个,不多不少的字母词。

标签: pythonregex

解决方案


您可以准确地查找三个单词字符,由单词边界包围:

import re

s2 = 'I, a: be; go! cat@ DOG# aRe, home: WORK; ninja! rules@'
m = re.findall(r'\b\w{3}\b', s2) 
print(m)
# ['cat', 'DOG', 'aRe']

推荐阅读