python - 根据索引值的条件在 Pandas DataFrame 中选择行
问题描述
假设我有以下多索引 DataFrame:
import pandas as pd
df = pd.DataFrame({'Index0':[0,1,2,3,4,5],'Index1':[100,200,300,400,500,600],'A':[5,2,5,8,1,2]})
现在我想选择 Index1 小于 400 的所有行。如果 Index1 是常规列,每个人都知道它是如何工作的:
df[df['Index1'] < 400]
因此,一种方法是reset_index
执行选择,然后再次设置索引。这似乎相当多余。
我的问题是:有没有办法直接做到这一点?当 DataFrame 具有行多索引时如何执行此操作?
解决方案
这里最简单的是使用query
:
df1 = df.query('Index1 < 400')
print (df1)
A
Index0 Index1
0 100 5
1 200 2
2 300 5
或者get_level_values
对于MultiIndex
with的选择级别boolean indexing
:
df1 = df[df.index.get_level_values('Index1') < 400]
详情:
print (df.index.get_level_values('Index1'))
Int64Index([100, 200, 300, 400, 500, 600], dtype='int64', name='Index1')
如果级别没有按位置选择的名称,则查询使用ilevel_
带位置的特殊关键字:
df.index.names = [None, None]
print (df)
A
0 100 5
1 200 2
2 300 5
3 400 8
4 500 1
5 600 2
df1 = df.query('ilevel_1 < 400')
df1 = df[df.index.get_level_values(1) < 400]
print (df1)
A
0 100 5
1 200 2
2 300 5
推荐阅读
- sendkeys - Pywinauto Sendkeys 函数
- .net - 如何在多线程函数中修改全局数组
- mysql - mysql在一个月内每天获取客户端的平均值
- tensorflow - 初始化权重的值应该是多少
- python - 创建一个新函数或只是普通打印以从另一个函数中获取值
- python - 如何将 weekday_name 函数用于日期时间的日/月/年格式
- android - Android - 默认警报对话框按钮位置到对话框底部
- autodesk-forge - 如何使用 Autodesk.Beeline
- graph - Neo4j 是否有任何性能测试,以及在现实世界实践中使用它的优缺点
- jasper-reports - JasperSoft Studio - 当 TextField 位于 TABLE 内且表位于 DETAIL 带内时,如何使 TextField 的高度动态(溢出时拉伸)