python - 在使用 str.findall 时获取 pandas 系列中的索引
问题描述
我正在寻找包含特定字符串的行。该数据集有近 100 万行。这是一个简单的例子;
text=['abc USER@xxx.com 123 any@www foo @ bar 78@ppp @5555 aa@111www','anontalk.com']
text=pd.Series(text)
srhc=text.str.findall('www')
srhc
输出是;
0 [www, www]
1 []
dtype: object
是否可以有效地(即以编程方式)仅获取包含 text 的索引列表www
。帮助表示赞赏。
解决方案
我们可以str
contains
做nonzero
srhc=text.str.contains('www').to_numpy().nonzero()[0]
srhc
Out[66]: array([0], dtype=int64)
推荐阅读
- android - Google Location API 的问题
- python - reading a text file and counting how many times a word is repeated. Using .split function. Now wants it to ignore case sensitive
- django - 我无法在 django 的注册表单中自定义密码字段的样式
- c++ - c++ How to read from a file into array one word at a time
- python-3.x - 我自己的方法返回 None 而不是有效值
- android - Problem in FirebaseDatabase.getInstance().reference
- python - OpenCV DNN 人脸检测器
- angular - 如何使用 ngx-formly 实现动态自定义模板
- javascript - How to test conditional rendering of components using Jest and Enzyme
- node.js - 电子事件发射器错误,而 app.quit 关闭所有打开的渲染器进程