python - 按列分组并在两个组中查找 ID
问题描述
我有一个看起来像这样的数据框
id | date | year| cohort
17482| 2017-01-01| 2017| tier 1
17482| 2017-01-01| 2017| tier 2
17483| 2017-01-01| 2017| tier 2
17483| 2017-01-01| 2017| tier 2
我想按年份和队列分组,并找到每个队列每年的唯一 ID 数。我使用以下代码
df.groupby(['year', 'cohort'])['id'].nunique().reset_index()
代码的输出是
年份|同类群组|id 2017|第 1 层|400 2017|第 2 层|600
但是,2017 年只有 500 个唯一 ID。因此我想找到同时位于 1 层和 2 层的 ID
解决方案
问题不清楚。请尝试让我们知道。乐于提供进一步帮助
df.groupby(['id','year','cohort']).size()
推荐阅读
- mysql - Confluent kafka jdbc连接查询方式
- javascript - 我的函数如何知道我的 object.value,因为我传入了一个 void 参数?
- python - 熊猫阅读 csv 并在引号中使用转义引号
- python-3.x - 我的列表理解不正确吗?
- javascript - aws cognito 电子邮件更改
- c - DISLIN 不适用于代码块
- angular - 如何在不通过 [formControl] 嵌套表单标签的情况下对输入进行自定义验证?
- javascript - 等到所有 http GET 请求完成后再登录到 JS 中的控制台
- google-sheets - 在公式中使用一个单元格的值来查找特定的单元格
- ruby - Ruby 有“等于或”运算符吗?