首页 > 解决方案 > 如何根据条件将时间序列数据集划分为训练和测试?

问题描述

这是我的任务:

将数据拆分为两个数据集:训练数据集和测试数据集。训练数据集应包括前 7,111 次观察(直到 2004 年的最后一次观察)。目的是使用训练数据集预测 2005 年 1 月上午 9 点的 NOx 浓度值。因此,将原始数据集拆分为训练数据集和测试数据集。测试数据集应包括 2005 年 1 月每天上午 9 点的 31 个观测值

这些是我的数据集中的变量,它们是 9375 个观察值:

我用了:

airdata_train <- airdata[1:7111,]
airdata_test <- subset(airdata,Date > 31/01/2005 & Date <= 01/01/2005, select = airdata)

但我无法弄清楚如何提出多个条件。

标签: time-seriescross-validation

解决方案


推荐阅读