首页 > 解决方案 > 如何填充可变长度多元时间序列数据?

问题描述

我正在研究一个多元时间序列数据集,其中多个测量值由不同的传感器记录。测量次数因传感器而异。我的目标是使用 LSTM 模型进行异常检测。数据位于 pandas 数据框中,如下所示:

Sensor ID         Recorded     Measurement_B     Measurement_C
    1              1                0.4              0.1
    1              2                0.3              0.3
    1              3                0.6              0.5
    1              4                0.5              0.5
    1              5                0.55             0.3
    2              1                0                0
    2              2                0.55             0.1
    3              1                0.5              0.6
    3              2                0.8              0.7
    3              3                0.8              0.5

我在想我可以找到最大大小Sensor ID并尝试使用某种填充 0 GroupBy,但不知道如何做到这一点。

或者,我一直在尝试阅读有关使用 keras 的信息,pad_sequences但是不明白我的数据需要采用什么形状才能使用它(因为很多示例都被视为单变量序列)。每个都Sensor ID需要是一个列表数组(每个列表代表一个观察)吗?

任何建议将不胜感激。

标签: pythonnumpykerastime-serieslstm

解决方案


推荐阅读