首页 > 解决方案 > pandas reindex 填补缺失的日期

问题描述

我有一个带有日期索引的数据框。每个数据都是当月的第一天。我想每天填写索引中所有缺失的日期。

我认为这应该工作:

daily=pd.date_range('2016-01-01', '2018-01-01', freq='D')
df=df.reindex(daily)

但它返回NA的行中应该有数据(当月的第一个日期)有人能看到这个问题吗?

标签: pandasreindex

解决方案


使用reindexwith 参数method='ffill'resamplewith 以ffill获得更通用的解决方案,因为没有必要通过以下方式创建新索引date_range

df = pd.DataFrame({'a': range(13)},
                   index=pd.date_range('2016-01-01', '2017-01-01', freq='MS'))

print (df)
             a
2016-01-01   0
2016-02-01   1
2016-03-01   2
2016-04-01   3
2016-05-01   4
2016-06-01   5
2016-07-01   6
2016-08-01   7
2016-09-01   8
2016-10-01   9
2016-11-01  10
2016-12-01  11
2017-01-01  12

daily=pd.date_range('2016-01-01', '2018-01-01', freq='D')
df1 = df.reindex(daily, method='ffill')

另一种解决方案:

df1 = df.resample('D').ffill()  

print (df1.head())
            a
2016-01-01  0
2016-01-02  0
2016-01-03  0
2016-01-04  0
2016-01-05  0

推荐阅读