首页 > 解决方案 > 按列分组并在两个组中查找 ID

问题描述

我有一个看起来像这样的数据框

id   | date      | year| cohort
17482| 2017-01-01| 2017| tier 1 
17482| 2017-01-01| 2017| tier 2
17483| 2017-01-01| 2017| tier 2 
17483| 2017-01-01| 2017| tier 2

我想按年份和队列分组,并找到每个队列每年的唯一 ID 数。我使用以下代码

df.groupby(['year', 'cohort'])['id'].nunique().reset_index()

代码的输出是

年份|同类群组|id 2017|第 1 层|400 2017|第 2 层|600

但是,2017 年只有 500 个唯一 ID。因此我想找到同时位于 1 层和 2 层的 ID

标签: pythonpandaspandas-groupby

解决方案


问题不清楚。请尝试让我们知道。乐于提供进一步帮助

df.groupby(['id','year','cohort']).size()

推荐阅读