python - 如何在熊猫数据框中搜索元素列表
问题描述
我的意思是我需要来自 search_list 的 Original_dataframe 所需的 output_dataframe 和 specific_indexes?怎么做?以最快的方式?
原始数据框:
textA TextB
0 a zz
1 bbb zzzzz
2 ccc zzz
搜索列表:
search_list = ['a','ccc']
我的意思是我需要来自 search_list 的 Original_dataframe 所需的 output_dataframe 和 specific_indexes
所需的输出数据帧:
textA TextB
0 a zz
2 ccc zzz
所需的输出 specific_indexes:
specific_indexes [0, 2]
计算时间是最重要的。
解决方案
如果需要检查用于索引使用的任何列:
idx = df.index[df.isin(search_list).any(axis=1)]
df1 = df[df.isin(search_list).any(axis=1)]
通过更好的性能过滤器索引检查一列:
idx = df.index[df['textA'].isin(search_list)]
df1 = df[df['textA'].isin(search_list)]
推荐阅读
- sorting - 为什么我们也使用大 O 表示法来表示最佳和平均情况?
- php - 调试 exec() PHP: "sh: *.exe : 无法执行二进制文件"
- eclipse - 在 SWT 向导页面中如何仅在单击下一步按钮时编写事件
- umbraco - Umbraco 无法启动。配置了连接字符串,但 Umbraco 无法连接到数据库
- r - 由于未指定面板数据,因此使用受访者编号选择面板数据
- javascript - 如何删除包含搜索文本的父 div
- linux - 如何防止 Linux 内核在 RAM 即将耗尽时驱逐文件支持的可执行页面?(否则会导致磁盘抖动)
- azure-application-insights - 自定义查询的 Application Insights 警报
- ocr - smartFix:Tarmed 产品中 TopDown 字段的扩展
- javascript - 使用 fetch() 发出问题并承诺提取多个图像文件的 url 和 url 路径