首页 > 解决方案 > LSTM 序列长度

问题描述

向大家问好!

我想问一下 LSTM 网络是否存在一般的最佳序列长度,或者就时间序列预测问题而言?

我读到了非常长的 RNN 网络存在的梯度消失或梯度爆炸问题,LSTM 试图解决并在一定程度上取得了成功。

我还听说过使用 LSTM 和 RNN 处理非常大的序列的技术,例如:截断序列、总结序列、截断随时间的反向传播,甚至使用编码器-解码器架构。

我问这个问题是因为我没有找到关于这个的研究论文,只有这篇博客文章说明了10-30 之间的最佳序列长度

提前致谢!

祝你今天过得愉快!

标签: pythondeep-learninglstmpytorchrnn

解决方案


做一些模型选择。

TLDR:试试吧。

因为训练在计算上已经非常昂贵,所以计算模型成功程度的最简单方法是对其进行测试。最有效的组合不容易预先确定,尤其是对于实际问题的外观没有如此模糊的描述(或根本没有描述)。

这个答案

这完全取决于数据的性质和内部相关性,没有经验法则。但是,鉴于您拥有大量数据,2 层 LSTM 可以对大量时间序列问题/基准进行建模。

因此,在您的情况下,您可能想尝试从 10 到 30 的序列长度。但我也会尝试通过您链接的帖子评估您的训练算法在该建议之外的执行情况。


推荐阅读