pandas - 有没有办法根据熊猫中的唯一值对列进行排序?
问题描述
假设我有一个包含日期和 ID 列的数据框。这是一个时间序列数据集。所以我需要为这个数据框生成一个时间序列标识符。也就是说,我需要添加一个对应于每个唯一集的值。有没有办法做到这一点 ?
df = pd.DataFrame({'Date':[2012-01-01, 2012-01-01, 2012-01-01, 2012-01-02, 2012-01-02, 2012-01-03, 2012-01-03, 2012-01-03, 2012-01-04, 2012-01-01, 2012-01-04],
'Id':[1,2,3,4,5,6,7,8,9,10,11]})
print(df)
输出:
Date Id
2012-01-01 1
2012-01-01 2
2012-01-01 3
2012-01-02 4
2012-01-02 5
2012-01-03 6
2012-01-03 7
2012-01-03 8
2012-01-04 9
2012-01-01 10
2012-01-04 11
我需要根据它的独特性来排序日期,比如
Date Id TimeID
2012-01-01 1 0
2012-01-02 4 0
2012-01-03 6 0
2012-01-04 9 0
2012-01-01 2 1
2012-01-02 5 1
2012-01-03 7 1
2012-01-04 11 1
2012-01-01 3 2
2012-01-03 8 2
2012-01-01 10 3
解决方案
GroupBy.cumcount
与 一起使用DataFrame.sort_values
:
df['TimeID'] = df.groupby('Date').cumcount()
df = df.sort_values('TimeID')
print (df)
Date Id TimeID
0 2012-01-01 1 0
3 2012-01-02 4 0
5 2012-01-03 6 0
8 2012-01-04 9 0
1 2012-01-01 2 1
4 2012-01-02 5 1
6 2012-01-03 7 1
10 2012-01-04 11 1
2 2012-01-01 3 2
7 2012-01-03 8 2
9 2012-01-01 10 3
推荐阅读
- python - 对隐式列名的操作
- file-manager - DotNetNuke 中的文件管理器模块
- typescript - 如何在 ag-grid 中禁用箭头键、主页键和结束键作为导航?
- vue.js - 用于多个异步上传的 axios 所有进度条
- android - 如何注入这样的网络模块?
- angularjs - 如何在 angularJS 中显示 HTML 内容值
- javascript - Adobe Photoshop Extension 打开另存为对话框
- javascript - 如何在技术上避免不正确的比较功能?
- python - while loop:::iterate line only 1 次,while value 在条件满足时迭代
- reactjs - 如果通过 next/router 或 next/link 重定向,NextJS 禁用 getinitialProps