pandas - 在另一列熊猫上删除具有特定条件的重复值
问题描述
我想在“Nit”上删除重复值,但在日期“Date”为 31-12-2018 时保留
Nit sales date
12345 56 31-12-2018
12345 45 31-06-2018
23346 87 31-12-2018
76553 93 31-12-2018
44556 34 31-06-2018
44556 52 31-12-2018
解决方案
我们试试看:
(df.assign(valid_date=df['date']=='31-12-2018')
.sort_values('valid_date', ascending=False)
.drop_duplicates('Nit')
.sort_index()
.drop('valid_date', axis=1)
)
输出:
Nit sales date
0 12345 56 31-12-2018
2 23346 87 31-12-2018
3 76553 93 31-12-2018
5 44556 52 31-12-2018
注意:一个简单的
df[df['date']=='31-12-2018']
可以做你想做的。
推荐阅读
- c# - 在 Xamarin C# Visual Studio 中创建 TableView
- javascript - 如何使用javascript集成字符串中字符的计数频率
- c# - 始终使用最新版本的 Newtonsoft.Json
- c# - 无法首先在列实体框架代码上定义 PRIMARY KEY 约束
- emacs - 使用估计在 emacs org-mode 中自动安排待办事项
- r - Safari 浏览器上的 Shinyapps.io 无法连接到服务器“localhost”
- python-3.x - cv2.HoughCircles 需要超过 15 分钟才能运行
- javascript - 路由时AngularJs memoryLeak
- javascript - 如何使用firebase函数从文档中查询一个数字并将其全部汇总到firestore中的父文档中
- azure - 构建用于 PowerShell 查询的 Azure API 标头