首页 > 解决方案 > 聚合具有相同id号的行并基于聚合输入列值

问题描述

df = pandas.DataFrame( { 
    "ID" : ["1123", "2325", "9788", "1123", "9788" , "5421"] , 
    "Type" : ["Red", "Black", "Black", "Black", "Red", "Black"] } )

df 应如下所示 - 请注意 ID 号 1123 和 9788 具有黑色和红色“类型”

     ID     Type
0   1123     Red
1   2323    Black
2   9788    Black
3   1123    Black
4   9788     Red
5   5421    Black

我想编写一些聚合行的代码。如果 ID 号同时具有黑色和红色“类型”,我希望它显示为红色,否则为黑色,如下所示。

     ID     Type
0   1123    Red
1   2323    Black
2   9788    Red
3   5421    Black

标签: pythonpandasdataframefor-loopif-statement

解决方案


公正groupby取值max(因为“红”>“黑”):

df.groupby('ID', as_index=False)['Type'].max()

输出:

     ID   Type
0  1123  Red  
1  2325  Black
2  5421  Black
3  9788  Red  

更新:如果您有更多类型,您可以转换为有序分类,指定所需的顺序,然后以完全相同的方式使用groupby和:max

df['Type'] = pd.Categorical(df['Type'],
                            categories=['Black', 'Green', 'Blue', 'Red'],
                            ordered=True)

df.groupby('ID', as_index=False)['Type'].max()

在这里,我们将有“黑色”<“绿色”<“蓝色”<“红色”


推荐阅读