首页 > 解决方案 > 为什么我在运行 ADF 测试时出现 MemoryError?

问题描述

在此处输入图像描述

这是我的时间序列:


                          data    z_data   zp_data
time                                              
2018-01-01 00:00:00  -0.045988       NaN       NaN
2018-01-01 00:01:00  -0.046024       NaN       NaN
2018-01-01 00:02:00  -0.044360       NaN       NaN
2018-01-01 00:03:00  -0.044722       NaN       NaN
2018-01-01 00:04:00  -0.043637       NaN       NaN
                        ...       ...       ...
2018-12-12 23:55:00  11.454639  0.088124  1.631736
2018-12-12 23:56:00  11.498422  0.935382  2.551753
2018-12-12 23:57:00  11.521695  1.251496  1.223949
2018-12-12 23:58:00  11.476974  0.244583 -0.012273
2018-12-12 23:59:00  11.480120  0.278023  0.015562
[498240 rows x 3 columns]


我使用了增强的 Dickey-Fuller 测试。该测试用于评估时间序列是否平稳。但我得到了 MemoryError。我该如何解决这个问题?

标签: pythontime-seriesstatsmodels

解决方案


autolag正在浪费内存,因为它在滞后搜索期间将所有完整模型保留在内存中。

https://github.com/statsmodels/statsmodels/issues/1849

一些可能的解决方法是

  • 修复滞后数并避免自动滞后搜索,或
  • 限制maxlag为滞后搜索评估的滞后数 set

这并不是真正考虑到大时间序列而设计的。


推荐阅读