首页 > 解决方案 > Pandas:如果 id 在 pandas 数据框中的特定列中出现至少 3 次,则检查 True/False

问题描述

我有一个带有“ID”列的 csv 文件。我想检查文件中的“ID”列中是否至少出现了 3 次相同的 ID。如果是,则将其标记为True,如果不是,则将其标记为False并将结果添加到同一数据框中的新列中。

到目前为止我的代码:

combined_csv['threeIDs'] = (combined_csv['ID'].value_counts() > 2)

上面的代码添加了额外的列(三个ID),但是它是空的并且不包含真/假结果。

有人可以帮忙吗?先感谢您!

标签: pythonpandas

解决方案


使用groupby().transform

combined_csv['threeIds'] = combined_csv.groupby('ID')['ID'].transform('size')>=3

推荐阅读