首页 > 解决方案 > 将一个 RNN 的隐藏状态转移到另一个 RNN

问题描述

我正在使用强化学习来教 AI 一种名为 Schnapsen 的信息不完整的奥地利纸牌游戏。对于不同的游戏状态,我有不同的神经网络(使用不同的特征)来计算价值/策略。我想尝试使用 RNN,因为过去的操作可能对未来的决策很重要。

然而,当我使用多个神经网络时,我不知何故需要不断地将隐藏状态从一个 RNN 转移到另一个 RNN。我不太能做到这一点,尤其是在训练期间,我不知道如何通过时间进行反向传播。我很感激任何建议或相关论文/博客的链接!

我目前正在 Julia 中使用 Flux,但我也愿意在 Python 中切换到 Tensorflow 或 Pytorch。

先感谢您!

标签: recurrent-neural-networkreinforcement-learningback-propagation-through-time

解决方案


推荐阅读