首页 > 解决方案 > 在对第一个 pandas python 进行排序时保持第二级多索引完整

问题描述

我使用以下方法对我的第一级索引进行了排序:groupby pandas python 的自定义排序顺序函数

def my_func(group):
    return sum(group["B"]*group["C"])

idx=df.groupby('A').apply(my_func).reindex(df.index.get_level_values(0))
df.iloc[idx.argsort()]

问题是第二级排序在第一级排序后混乱了。如何确保保持集团内订单?

A   B C
1 0 1 8
  1 3 3
2 0 1 2
  1 2 2
3 0 1 3
  1 2 4

A   B C
2 0 1 2
  1 2 2
3 0 1 3
  1 2 4
1 0 1 8
  1 3 3

而不是(最后两行倒置)

A   B C
2 0 1 2
  1 2 2
3 0 1 3
  1 2 4
1 1 3 3
  0 1 8

标签: pythonpython-3.xpandaspandas-groupby

解决方案


我认为您需要稳定的排序算法- mergesort

idx=df.index.get_level_values(0).map(df.groupby('A').apply(my_func))
df = df.iloc[idx.argsort(kind='mergesort')]
print (df)
     B  C
A        
2 0  1  2
  1  2  2
3 0  1  3
  1  2  4
1 0  1  8
  1  3  3

推荐阅读