首页 > 解决方案 > 在python中只选择ID的最新记录

问题描述

我正在寻找一种在 python 中仅按 ID 选择最新日期观察的方法。什么是最好最有效的方法?(我不想排序,我只想隔离最新的观察结果)我尝试了以下方法:

data1.loc[data1.groupby('id')['date'].idxmax()]

但它不起作用。

标签: pythondatetransactions

解决方案


示例数据框

数据1:

    id  date
0   id1 2019-03-19
1   id1 2019-01-11
2   id1 2019-07-23
3   id2 2020-04-03
4   id2 2020-02-03

这将做:

data1['date'] = pd.to_datetime(data1.date)
data1.groupby(["id"]).agg({'date' : np.max})

    date
id  
id1 2019-07-23
id2 2020-04-03

推荐阅读