首页 > 解决方案 > Pandas:从排序的数据框中提取数据

问题描述

考虑我有一个包含 2 列的数据框:第一列是字符串形式的“名称”,第二列是 int 类型的“分数”。有许多重复的名称,它们被排序,这样所有的 'Name1' 将在连续的行中,然后是 'Name2',依此类推。每行可能包含不同的分数。每个唯一字符串的重复名称的数量也可能不同。

我希望从此数据框中提取数据并将其放入新的数据框中,以便名称列中没有重复的名称,并且每个名称的相应分数是他在原始数据框中的分数的平均值。

我提供了一张图片以获得更好的可视化效果: x 不一定等于 y。

标签: pandasdataframe

解决方案


首先使用groupby()@QuangHong提到的方法:

result=df.groupby('Name', as_index=False)['Score'].mean()

最后使用rename()方法:

result=result.rename(columns={'Score':'Avg Score'})

推荐阅读