首页 > 解决方案 > 正则表达式匹配特定字符串,空格,然后是数字(熊猫,python)

问题描述

我的数据框:

pd.DataFrame({'module_num': ['Assignment Module 6 Due', 'Review of Module 2 Checklist', 'Welcome to Module 7 Chapter 25']})

我是 python 中正则表达式的新手,我希望我可以使用 regex 和 pandas 获得以下输出:

    pd.DataFrame({'module_num': ['Module 6', 'Module 2', 'Module 7']})

所以,我试图匹配字符串“模块”和它后面的数字。在每种情况下,模块和数字之间都有一个空格。

标签: pythonpython-3.xregexpandas

解决方案


利用,Series.str.extract

regex demo

df.module_num.str.extract("(Module \d+)")

          0
0  Module 6
1  Module 2
2  Module 7

推荐阅读