首页 > 解决方案 > 在这些日期时间使用日期时间索引的采样来选择熊猫数据框中的特征(行)

问题描述

我有一个日期时间索引对象,它由我正在训练学习者的 LARGER 数据帧中随机采样的数据的索引值组成。我想使用日期时间索引,例如

DatetimeIndex(['1911-11-18', '2015-05-02', '1934-08-15', '1950-09-16',
               '1944-06-01', '2004-07-30', '1947-11-18', '1977-07-08',
               '1945-05-31', '1944-01-31',
               ...
               '1884-06-24', '1999-11-22', '1960-02-02', '1883-03-08',
               '1952-11-19', '1993-02-04', '1965-04-26', '1885-09-30',
               '1890-02-26', '2008-03-28'],
              dtype='datetime64[ns]', length=300000, freq=None)

将每个训练示例返回到完整数据框并查找那些日子的目标值,然后从该日期开始往后 1 年用作真正的目标。

整体背景是对来自时间序列数据的随机样本进行训练,并针对未来的一个值。

我的大数据框叫做 toLearn。我正在训练的示例数据框称为 dataSlice(toLearn 的子集)。

标签: pythonpandasdataframetime-series

解决方案


以下内容适用于我正在尝试做的事情。

 # Find Target 7 years after Each Training Sample 

indicesOfTrainSamples=trainSamples.index
indicesOfTarget=indicesOfTrainSamples + pd.Timedelta(weeks=7*52)

targets=[]
for i in indicesOfTarget:
     targets.append(toLearn.loc[i])

targetSlices=pd.DataFrame(targets,index=indicesOfTarget)
targetFeature=targetSlices['targetValues']

推荐阅读