首页 > 解决方案 > 了解熊猫系列提取函数中的正则表达式

问题描述

我有以下代码:

import pandas as pd
s = pd.Series(['toy story (1995)', 'the pirates (2014)'])
print(s.str.extract('.*\((.*)\).*',expand = True))

输出:

     0
0  1995
1  2014

我知道提取函数正在为两个系列对象提取括号之间的值。但是我不明白怎么做。究竟是什么'.*\((.*)\).*'意思?我认为星号代表通配符,但除此之外,我对这个表达式的实际情况感到非常困惑。

标签: pythonstringpandasexpressionextract

解决方案


.*\(匹配所有内容,直到第一个(

\).*匹配从)到最后的所有内容

(.*)返回前两场比赛之间的所有内容


推荐阅读