首页 > 解决方案 > 在 Python 中按 client_id 分组并计算归属事件

问题描述

我是 Python 新手,正在处理这样一种数据集的情况:

client_id    event_name
123          event_1
1234         event_1
123          event_2
12           event_1
123          event_1

我想调整我的数据集,以便按客户端计算事件,如下所示:

client_id    event_1  event_2
123          2        1
1234         1        0
12           1        0

我的目标与这个主题相似,但我的事件在同一列(event_name)中,需要分成不同的列(event_1、event_2 等)。

我已经为此苦苦挣扎了一天,我认为 Python 可能有一个我目前看不到的简单解决方案。如果有人可以帮助我,那就太好了!

标签: pythonpandaspandas-groupby

解决方案


client-id、每个事件的count_values和 unstack 分组。

data.groupby('client_id')['event_name'].value_counts().unstack().reset_index(drop=False)

推荐阅读