reinforcement-learning - 为什么我们总是需要为 open gym ai 设置 env.seed(#)?
问题描述
我发现所有强化学习算法都需要第一手设置 env.seed(#),我想知道它背后的原因。
非常感谢!
解决方案
我使用过的所有健身房环境都使用了numpy 的随机数生成器。您当然不需要自己播种,因为它会回到当前时钟时间播种。每当您担心可重复性时,都会手动指定种子。如果你不给你的RNG同样的种子,它会产生一个不同的随机数序列。由于机器学习如此受经验驱动,因此可重复性非常重要。
推荐阅读
- node.js - 异步函数执行顺序错误
- r - 在r中绘制多条水平线
- node.js - 带有 Promise 的错误数据库触发云功能
- sql - sysdate 格式在 where 子句中不起作用
- r - 使用 ifelse 条件拆分 R 中的列
- android - 自定义字体不适用于 EMUI 或自定义 Android 操作系统
- java - 我正在尝试制作一个看起来像 PC 终端的基于文本的游戏,但我无法找到一种方法来告诉用户他们是否使用了错误的句子
- c# - 为什么当我尝试从 VBA 调用时我的 C# 方法不可见
- debian - Net-SNMP/snpmd pass 脚本不使用守护进程,但使用调试模式
- python - 抓取该网站的最佳方法是什么?(不是硒)