python - 如何填充可变长度多元时间序列数据?
问题描述
我正在研究一个多元时间序列数据集,其中多个测量值由不同的传感器记录。测量次数因传感器而异。我的目标是使用 LSTM 模型进行异常检测。数据位于 pandas 数据框中,如下所示:
Sensor ID Recorded Measurement_B Measurement_C
1 1 0.4 0.1
1 2 0.3 0.3
1 3 0.6 0.5
1 4 0.5 0.5
1 5 0.55 0.3
2 1 0 0
2 2 0.55 0.1
3 1 0.5 0.6
3 2 0.8 0.7
3 3 0.8 0.5
我在想我可以找到最大大小Sensor ID
并尝试使用某种填充 0 GroupBy
,但不知道如何做到这一点。
或者,我一直在尝试阅读有关使用 keras 的信息,pad_sequences
但是不明白我的数据需要采用什么形状才能使用它(因为很多示例都被视为单变量序列)。每个都Sensor ID
需要是一个列表数组(每个列表代表一个观察)吗?
任何建议将不胜感激。
解决方案
推荐阅读
- excel - 带变量的 Vlookup
- outlook - span 上的border-bottom 属性会影响outlook365 中各个元素的所有边框
- python - Pyinstaller 在创建 exe 时无法找到项目依赖项的 dll
- android - 如果前一个和当前的 apk 是由 2 台不同的机器创建的,是否可以更新调试 apk
- ios - 视图控制器采用 MXSegmentedPagerControllerDataSource 但未调用 viewControllerForPageAt 必须使用函数 viewForPageAt
- python - python函数返回的对象的对象ID
- memory-management - 如何在redis服务器中阻止所有写入并只允许读取?
- ios - 修改太多字节的 Data 对象会使 swift 应用程序崩溃
- ios - TimeZone:获取缩写而不是 GMT 偏移量
- vagrant - Vagrant LXC 盒子可以下载吗?