首页 > 解决方案 > Pandas - 具有多个条件的 drop_duplicates

问题描述

我有一个数据集,我想根据某些条件删除重复项。

例如,假设我有一张桌子

ID  date    group
3001    2010    DCM
3001    2012    NII
3001    2012    DCM

我想说查看类似 ID 的 ID 列,如果两个日期相似,则保留该组为 NII 的行

所以它会变成

ID  date    group
3001    2010    DCM
3001    2012    NII

标签: pythonpandasdataframeduplicates

解决方案


在这里利用duplicated

df[~df.duplicated(['ID', 'date'], keep=False) | df['group'].eq('NII')]

     ID  date group
0  3001  2010   DCM
1  3001  2012   NII

推荐阅读