pandas - 带有多索引的 pandas pivot_table()
问题描述
我有一个包含电影列信息的数据框:评分、性别、年龄、职业、邮编、电影标题
如果我执行如下数据透视表
df.pivot_table('rating', index = 'title', columns = ["occupation",'gender'], aggfunc ='mean')
它会自动计算每个性别的评分平均值,然后将其放在相应的职业下吗?看看结果,这似乎是正确的,但我只是想确定一下。
解决方案
我认为代码是正确的,应该用 omit 简化aggfunc
,因为默认函数是np.mean
:
df = df.pivot_table('rating', index = 'title', columns = ["occupation",'gender'])
您还可以指定每个参数:
df = df.pivot_table(index = 'title',
columns = ["occupation",'gender'],
values='rating')