首页 > 解决方案 > Pandas:如何在 groupby 之后将值分配给组的第一行?

问题描述

我试图在 groupby 之后将值分配给组的第一行?

输入:

编号
Aa 100
Bb 200
Cc 300
Bb 400
Aa 500

输出:

ID Num Sum
Aa 100 600
Aa 500
Bb 200 600
Bb 400
Cc 300 300

代码:

base_df['Sum'] = base_df.groupby(['ID'])['Num'].transform('sum')

但是,此代码将为组中的每一行分配值“Sum” :

我的输出:

ID Num Sum
Aa 100 600
Aa 500 600
Bb 200 600
Bb 400 600
Cc 300 300

标签: pythonpandasdataframe

解决方案


您可以使用分配duplicated

s = df.groupby(['ID'])['Num'].transform('sum')
df.loc[~df.duplicated("ID"), "Sum"] = s
print (df)

   ID  Num    Sum
0  Aa  100  600.0
1  Bb  200  600.0
2  Cc  300  300.0
3  Bb  400    NaN
4  Aa  500    NaN

推荐阅读