首页 > 解决方案 > 计算与新列中平均值的差异

问题描述

data = {'score': [91, 93, 72, 87, 86, 73, 68, 87, 78, 99, 95, 76, 84, 96, 76, 80, 83, 84, 73, 74],
    'hours': [16, 6, 3, 1, 2, 3, 2, 5, 2, 5, 2, 3, 4, 3, 3, 3, 4, 3, 4, 4],
    'prep': [3, 4, 0, 3, 4, 0, 1, 2, 1, 2, 3, 3, 3, 2, 2, 2, 3, 3, 2, 2],
    'grade': [70, 88, 80, 83, 88, 84, 78, 94, 90, 93, 89, 82, 95, 94, 81, 93, 93, 90, 89, 89],
    'school': [0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1]}

df = pd.DataFrame(data,columns=['score', 'hours', 'prep','grade',"school"])
df

在我的数据框中,每一行代表一个学生。我想创建一个名为“平均分差”的新列。此列的值将由个人学校的平均分数与他们自己的分数之间的差异填充,其中“学校”列中的值 0 或 1 代表个人所在的学校。

任何帮助将不胜感激

标签: pythonpandasdataframenumpy

解决方案


推荐阅读