首页 > 解决方案 > A2C 稳定基线中熵系数的线性时间表

问题描述

我在稳定的基线中看到可以评估线性时间表,以便在训练期间不断降低学习率。

我想知道在稳定的基线中是否有任何实现,可以使用线性计划来降低训练期间 A2C 模型中的熵系数。

任何帮助将非常感激。

标签: pythonreinforcement-learningstable-baselines

解决方案


推荐阅读