首页 > 解决方案 > 创建一个新列,其中包含另一列中某个值的出现次数

问题描述

我有一个病人入院的数据框,每个病人都有一个唯一的标识符。一些患者有多次遭遇,因此他们的唯一标识符多次出现在数据框中。我想只保留每个患者的第一次遭遇,并创建一个新列,其中包含每个标识符存在的遭遇次数。关于如何使用熊猫来做到这一点的任何想法?

唯一标识符 相遇日期
1001 能源部 2021 年 1 月 2 日
1002 约翰 能源部 2021 年 1 月 2 日
1001 能源部 2021 年 7 月 2 日

生成的数据框将如下所示:

唯一标识符 相遇日期 Number_of_encounters
1001 能源部 2021 年 1 月 2 日 2
1002 约翰 能源部 2021 年 1 月 2 日 1

标签: pythonpandasdataframedata-science

解决方案


推荐阅读