首页 > 解决方案 > 使用相似时间序列估算时间序列

问题描述

我有一个问题,我有很多关于 1 年恒温器记录的数据,每个小时它都会给我那个家庭的平均温度。但是很多数据是不可用的,因为他们只是在年中安装了温控器,或者他们把温控器放了一个星期或者......但是很多这个温控器的数据真的很相似。我想要做的是使用类似的时间序列来估算丢失的数据。

因此,假设 A 房屋仅在 7 月开始,但从那里它们与家庭 BI 非常相似,然后想要使用 B 家庭的信息来预测 A 房屋 7 月之前的数据。

我正在考虑训练一个可以为我做到这一点的循环神经网络,但我不确定有什么可以做到这一点,当我搜索论文时,他们几乎只在多年的数据集上工作,并使用往年的数据。我没有这些数据,所以这不是一个选择。

有没有人知道如何解决这个问题或我可以使用解决类似问题的参考?

标签: machine-learningtime-seriesmissing-dataforecastingimputation

解决方案


据我了解,您希望使用横截面数据而不是时间序列信息来估算数据。

实际上有很多插补包可以在 R 中为您执行此操作。(如果您使用的是 R)

您需要等间距的数据。所以每小时 1 个值,如果它不存在,那么它需要是 NA。因此,理想情况下,您将拥有多个定长的时间序列。

然后根据时间戳/小时合并这些时间序列。

之后,您可以使用基本上一行代码来应用一个估算包,例如 mice, 。这些包将使用不同时间序列之间的相关性来估计这些序列中的缺失值。missForestimputeR


推荐阅读