首页 > 解决方案 > 添加依赖于其他列的列

问题描述

我有一个 Pandas 数据框,如下所示:

touch_id      sequence_id      timestamp_event     x      y
-----------------------------------------------------------
1             1                500                 20     20
1             2                600                 40     40
1             2                700                 30     33
2             1                880                 33     0
2             1                900                 22     22
3             1                910                 1      1
3             1                920                 10     15
3             2                950                 15     15

在此数据框上,我应用以下内容:

df= df_touch.groupby(["touch_id", "sequence_id"]).agg({
    'timestamp_event': 'mean',
    'x': 'mean',
    'y': 'mean',
}).reset_index()


touch_id      sequence_id      timestamp_event     x      y
-----------------------------------------------------------
1             1                500                 20     20
1             2                650                 35     36.5
2             1                890                 27.5   11
3             1                915                 5.5    8
3             2                950                 15     15

现在我想要一个额外的列,当存在相同的几个不multi_seq同时,这是正确的。这意味着结果表应该是touch_idsequence_id

touch_id      sequence_id      timestamp_event     x      y        multi_seq
----------------------------------------------------------------------------
1             1                500                 20     20       True
1             2                650                 35     36.5     True
2             1                890                 27.5   11       False
3             1                915                 5.5    8        True
3             2                950                 15     15       True

如何创建此附加列multi_seq

标签: pythonpandaspandas-groupby

解决方案


IIUC, transform+nunique

df['multi_seq'] = df.groupby('touch_id').sequence_id.transform('nunique') > 1

0     True
1     True
2    False
3     True
4     True
Name: sequence_id, dtype: bool

推荐阅读