首页 > 解决方案 > QMIX(Multi-agent Reinforcement Learning) -> loss变成了nan

问题描述

起初,损失从16〜....开始,但在200〜300集之后,它变成了'nan'。请告诉我问题的原因。我该如何解决这个问题?

标签: reinforcement-learning

解决方案


推荐阅读