首页 > 解决方案 > 在使用 str.findall 时获取 pandas 系列中的索引

问题描述

我正在寻找包含特定字符串的行。该数据集有近 100 万行。这是一个简单的例子;

text=['abc USER@xxx.com 123 any@www foo @ bar 78@ppp @5555 aa@111www','anontalk.com']
text=pd.Series(text)
srhc=text.str.findall('www')
srhc

输出是;

0    [www, www]
1    []        
dtype: object

是否可以有效地(即以编程方式)仅获取包含 text 的索引列表www。帮助表示赞赏。

标签: pythonpandas

解决方案


我们可以str containsnonzero

srhc=text.str.contains('www').to_numpy().nonzero()[0]
srhc
Out[66]: array([0], dtype=int64)

推荐阅读