首页 > 解决方案 > 在另一列熊猫上删除具有特定条件的重复值

问题描述

我想在“Nit”上删除重复值,但在日期“Date”为 31-12-2018 时保留

Nit       sales    date

12345      56    31-12-2018
12345      45    31-06-2018
23346      87    31-12-2018
76553      93    31-12-2018
44556      34    31-06-2018
44556      52    31-12-2018

标签: pandasduplicatesdrop

解决方案


我们试试看:

(df.assign(valid_date=df['date']=='31-12-2018')
   .sort_values('valid_date', ascending=False)
   .drop_duplicates('Nit')
   .sort_index()
   .drop('valid_date', axis=1)
)

输出:

     Nit  sales        date
0  12345     56  31-12-2018
2  23346     87  31-12-2018
3  76553     93  31-12-2018
5  44556     52  31-12-2018

注意:一个简单的

df[df['date']=='31-12-2018']

可以做你想做的。


推荐阅读