首页 > 解决方案 > 最受欢迎的嵌套类别

问题描述

我有一个我试图在 python 中解决的问题。我有一个数据框

df = pd.DataFrame{'company':[1,1,1,1,2,2,3,3,3],'category':['a','a','a','c','a','b','b','b','a']}

在此处输入图像描述

而且我想知道,按公司划分,最受欢迎的类别是什么,输出是:

在此处输入图像描述

对于公司 2,它可以是 a 类或 b 类,而不是两者,可以随机选择。

谢谢!

标签: pythonpandas

解决方案


这是groupby()mode

df.groupby('company', as_index=False)['category'].apply(lambda x: x.mode()[0])

输出:

   company category
0        1        a
1        2        a
2        3        b

推荐阅读