首页 > 解决方案 > 仅在同一天内重新采样

问题描述

我有一个包含资产价格(OHLC 资产数据)的数据框,其索引是日期时间。数据应该以分钟为样本,但我的数据集缺少一些分钟。

在此处输入图像描述

为了填补缺失的数据,我只使用了函数

df.resample("1Min").asfreq()

它在一天内正确填写了分钟,但由于我的数据框包含不同日期的数据,它通常会填写直到每天午夜的分钟。我希望,如果某一天包含从下午 13:05 到晚上 20:50 的数据,它仅在这些时间之间填充分钟,即不超过这些界限。

我查看了 resample 函数的文档,但找不到它是如何完成的。我感谢您的帮助!

标签: pythonpandas

解决方案


我相信你需要几天和DataFrame.groupby连锁:DataFrameGroupBy.resampleResampler.first

df = df.groupby(df.index.date).resample("1Min").first()

推荐阅读