首页 > 解决方案 > 根据条件从熊猫数据框中提取行

问题描述

我有熊猫数据框“数据”,并且只想保留每个类别“类”的“numb_people”总和至少为 2 的行。

但是,这会引发索引错误(索引不再匹配):

data = data[data.groupby('class').sum()['numb_people'] > 2]

我怎样才能以同样简单的方式做到这一点?

标签: pythonpandas

解决方案


正如@rafaelc 在评论中所说:

idx = data.groupby('class').numb_people.transform('sum') > 2
print(data[idx])

推荐阅读