首页 > 解决方案 > 堆叠 lstm 中的波动损失

问题描述

我正在训练无状态 LSTM 模型以进行具有 150 个奇数观测的单变量时间序列预测(我知道这个数字要少得多)。我使用的批量大小为 1,训练数据直到 145 个观察值,验证数据只有 5 个观察值。我在连续层中使用带有 (128, 32) 个神经元的 Stacked LSTM。使用 nadam,学习率为 0.01。还应用了耐心=300 的早期停止。(历元总数 = 1000)。

问题是训练和验证损失在迭代过程中波动很大。有什么办法可以稳定这种性能吗?

训练验证损失

标签: pythontensorflowdeep-learninglstm

解决方案


推荐阅读