首页 > 解决方案 > 删除重复项不适用于 python

问题描述

我在 python 中工作,并且有一个数据框(df),其中包括“CONTRACT_ID”列。此列中有不同的数字。还有另一列称为 NPV,由数字组成。

 CONTRACT_ID                       NPV          
0     1                            90                

1     1                            90                   

2     2                            130                     

3     2                            130   

4     3                            105

5     3                            105
...

...

我不希望这些重复项出现两次,因此我尝试使用以下代码删除重复项(仅在 CONTRACT_ID 列上):

df.drop_duplicates(subset=['CONTRACT_ID'], keep=False)

我的预期结果是这样的:

    CONTRACT_ID                    NPV                       
0     1                            90                  

1     2                            130                   

2     3                            105                 
    ...

但是代码不起作用。它运行没有错误,但它根本没有摆脱重复。难道我做错了什么?

谢谢!

标签: pythonpandas

解决方案


我想你忘记了重新签名DataFrame

df = df.drop_duplicates(subset=['CONTRACT_ID'], keep=False)

推荐阅读