首页 > 解决方案 > 根据索引值的条件在 Pandas DataFrame 中选择行

问题描述

假设我有以下多索引 DataFrame:

import pandas as pd
df = pd.DataFrame({'Index0':[0,1,2,3,4,5],'Index1':[100,200,300,400,500,600],'A':[5,2,5,8,1,2]})

示例数据框

现在我想选择 Index1 小于 400 的所有行。如果 Index1 是常规列,每个人都知道它是如何工作的:

df[df['Index1'] < 400]

因此,一种方法是reset_index执行选择,然后再次设置索引。这似乎相当多余。

我的问题是:有没有办法直接做到这一点?当 DataFrame 具有行多索引时如何执行此操作?

标签: pythonpandas

解决方案


这里最简单的是使用query

df1 = df.query('Index1 < 400')
print (df1)
               A
Index0 Index1   
0      100     5
1      200     2
2      300     5

或者get_level_values对于MultiIndexwith的选择级别boolean indexing

df1 = df[df.index.get_level_values('Index1') < 400]

详情

print (df.index.get_level_values('Index1'))
Int64Index([100, 200, 300, 400, 500, 600], dtype='int64', name='Index1')

如果级别没有按位置选择的名称,则查询使用ilevel_带位置的特殊关键字:

df.index.names = [None, None]
print (df)
       A
0 100  5
1 200  2
2 300  5
3 400  8
4 500  1
5 600  2

df1 = df.query('ilevel_1 < 400')

df1 = df[df.index.get_level_values(1) < 400]
print (df1)
       A
0 100  5
1 200  2
2 300  5

推荐阅读