time-series - 如何根据条件将时间序列数据集划分为训练和测试?
问题描述
这是我的任务:
将数据拆分为两个数据集:训练数据集和测试数据集。训练数据集应包括前 7,111 次观察(直到 2004 年的最后一次观察)。目的是使用训练数据集预测 2005 年 1 月上午 9 点的 NOx 浓度值。因此,将原始数据集拆分为训练数据集和测试数据集。测试数据集应包括 2005 年 1 月每天上午 9 点的 31 个观测值
这些是我的数据集中的变量,它们是 9375 个观察值:
- 日期 日期 (dd/mm/yyyy)
- 时间 时间 (hh:mm:ss)
- NOx 真实小时平均 NOx 浓度(ppb)
- NO2 真正的小时平均 NO2 浓度(以 microg/m3 为单位) 温度 以°C 为单位的温度
- RH 相对湿度 (% )
- AH 绝对湿度
我用了:
airdata_train <- airdata[1:7111,]
airdata_test <- subset(airdata,Date > 31/01/2005 & Date <= 01/01/2005, select = airdata)
但我无法弄清楚如何提出多个条件。
解决方案
推荐阅读
- java - 检索没有单个值的对象的子对象firebase android studio
- sql - SQL在求和和分组时加入多个表
- git - 获取我的本地功能分支与远程主分支没有过期的信息
- javascript - 为什么 React 函数组件的“this”未定义
- r - 为什么数学表达式嵌套在函数中与直接调用的输出不同?
- java - 建立连接后 SMTP GMAIL 服务器没有响应(java)
- javascript - 用于处理欧洲数字的正则表达式,反之亦然
- python - Intersection over union (IOU) metric for multi-class semantic segmentation task
- c++ - 对变量 ans 使用未初始化的内存
- elasticsearch - 每个 elasticsearch 节点的推荐最大 RAM 和磁盘大小是多少?