首页 > 解决方案 > 基于非日期时间列的升级数据密度

问题描述

我正在尝试根据遵循此模式的列中的值对数据密度进行上采样。

日期时间UTC ID snp 经度 纬度
2019 年 1 月 12 日 06:33 6223 120 -9.989304 60.551407
2019 年 1 月 12 日 04:57 3298 181 -10.06186 60.655212
2019 年 1 月 12 日 23:15 23559 12976 -9.342695 60.442307
2019 年 1 月 12 日 05:21 9105 4330 -10.027265 60.630966
2019 年 1 月 12 日 21:12 3693 7366 -9.292198 60.42049
2019 年 1 月 12 日 12:12 43487 32374 -9.993835 60.601185
2019 年 1 月 12 日 12:06 828 363 -10.003743 60.606808
2019 年 1 月 12 日 01:11 5018 2479 -10.156565 60.511314
2019 年 1 月 12 日 02:42 12303 8084 -9.994892 60.549812
2019 年 1 月 12 日 01:53 5050 2956 -10.067944 60.52226

我的目标是让 snp 列以 60 为增量增加并保留 ID,因此例如第 1 行和第 2 行将放大为:

日期时间UTC ID snp 经度 纬度
6223 60
2019 年 1 月 12 日 06:33 6223 120 -9.989304 60.551407
3298 1
3298 61
3298 121
2019 年 1 月 12 日 04:57 3298 181 -10.06186 60.655212

我尝试使用 df.resample() 函数,虽然我可以让它以日期时间格式工作,但我似乎无法将它应用于非日期时间值。

谢谢您的帮助。

标签: pythonpandaspandas-resample

解决方案


推荐阅读