首页 > 解决方案 > 如何在python中显示重复项?

问题描述

有我的数据集(head()): 在此处输入图像描述

我知道 user_id 中有一个重复项。我用这个查询检查它: sum(df2.user_id.duplicated())

现在我想知道这个用户ID。我怎样才能做到这一点?

提前致谢!

标签: pythonpandasduplicates

解决方案


您可以应用 loc 来获取重复的行。

   duplicated_rows = df2.loc[df2.user_id.duplicated()]

或获取身份证,

   duplicated_ids = df2.loc[df2.user_id.duplicated(), 'user_id']

推荐阅读