首页 > 解决方案 > 在多索引数据框 pandas 中进行聚合

问题描述

我正在寻求有关此多索引数据框的帮助

import numpy as np
import pandas as pd

array = [np.array(['jan','jan','feb','feb','mar','mar']), np.array(['food','rent','food','rent','food','rent'])]

df = pd.DataFrame(np.random.randint(0,high=100,size=(6,1)),index=array,columns=['expense'])

我试图总结整个数据框中“食物”和“租金”的数量 - 最简单的方法是什么?

标签: python-2.7pandasdataframemulti-index

解决方案


您可以groupby索引级别(food并且rent处于级别 1 索引):

df.groupby(level=1).sum()

#      expense
#food      166
#rent      161

推荐阅读