python - dqn 状态值是否应该仅为 0 到 1
问题描述
如果 DQN 中的状态值只需要为 0 到 1,例如 state = [0, 0, 0, 1, 1, 1, 1, 0, 1, 0]
或者它的状态值大于 1 eh state = [6, 5, 4, 1, 1, 1, 2, 3, 15, 10]
解决方案
国家本身不需要在价值上受到限制。您可以拥有任意大的范围。但出于训练目的,建议在 [0,1] 范围内对状态值进行归一化,以便使用函数逼近的神经网络不会饱和。
推荐阅读
- git - 如何使用 Git 撤消推送的合并?
- asp.net - 使用 SQL Server 和 Azure AD SSO 进行身份验证的 ASP.NET MVC 标识
- javascript - 如何在jquery点击功能中等待确认
- c# - Unity testrunner 在播放模式下运行 [Test]s 但不是 [UnityTests]
- bash - 使用 sed 替换 Deployment.yaml 模板文件字符串,所有与 env var $_ 匹配的模式
- webpack - 从 Webpack 转译中排除特定的 JS 文件,但包含在包中
- xamarin.forms - Xamarin 为 iOS 形成圆形图像
- arrays - 两个数组的交集 II 使用 C
- python - Odoo 12. 如何将二进制文件转换为 Zip?
- java - 在使用自定义 genericElement 的情况下,如何修复“没有为 namepsace 找到通用元素处理程序”错误?