首页 > 解决方案 > 带有多索引的 pandas pivot_table()

问题描述

我有一个包含电影列信息的数据框:评分、性别、年龄、职业、邮编、电影标题

如果我执行如下数据透视表

df.pivot_table('rating', index = 'title', columns = ["occupation",'gender'], aggfunc ='mean')

它会自动计算每个性别的评分平均值,然后将其放在相应的职业下吗?看看结果,这似乎是正确的,但我只是想确定一下。

结果

标签: pandaspivot-table

解决方案


我认为代码是正确的,应该用 omit 简化aggfunc,因为默认函数是np.mean

df = df.pivot_table('rating', index = 'title', columns = ["occupation",'gender'])

您还可以指定每个参数:

df = df.pivot_table(index = 'title', 
                    columns = ["occupation",'gender'],
                    values='rating')

推荐阅读