首页 > 解决方案 > 根据给定的数据框创建一个新的数据框

问题描述

我有一个看起来像这样的表:

用户身份 观察
25 2
25 3
25 2
23 1
23 3

期望的结果是:

用户身份 观察 保留
25 7 3
23 4 2

我想保留具有唯一 id 的用户 id 列,并有另一列显示该 id 在数据集中出现了多少次,以总结观察列的值。

任何帮助将不胜感激谢谢

标签: pythonpandasdataframe

解决方案


对其使用groupby()方法和链agg()方法:

outputdf=df.groupby('user id',as_index=False).agg(observation=('observation','sum'),retention=('observation','count'))

现在,如果您打印outputdf,您将获得所需的输出:

     user id    observation     retention
0       23          4               2
1       25          7               3

推荐阅读