首页 > 解决方案 > 使用 Soft-Actor Critic (SAC) 评估和更改在 RL 训练中使用的神经结构

问题描述

我目前正在训练使用来自 StableBaselines3 的 SAC 的自定义环境。我正在使用 MlpPolicy,据我了解,默认情况下它是一个 2 层 256 神经元神经网络。我对评估不同神经架构的训练性能很感兴趣,但是在经过大量谷歌搜索后,我能想到的最好的方法显示在下面的代码片段中。

policy_kwargs = dict(net_arch=[128, 128, 128])
model = SAC(MlpPolicy, env1, policy_kwargs=policy_kwargs, verbose=1)

问题是我不知道如何查看已经训练好的模型的神经架构来查看神经网络是否真的发生了变化。有没有办法可以从训练课程后创建的 model.zip 文件中找到使用的神经结构?在最近的一次讨论中,有人告诉我有一种方法可以查看训练期间使用的神经元百分比,以评估模型是否需要进行更多训练,并确定增加/减少神经层或神经元是否有益,但我没有找不到任何关于如何在代码中实现它的资源。

我是 RL 培训的新手,非常感谢任何资源或代码示例来完成上述任务。

标签: neural-networkpytorchreinforcement-learningsac

解决方案


推荐阅读