python - 我可以在 SB3 中创建上下文多臂强盗代理吗?
问题描述
我想知道是否可以创建一个等效于contextual Multi-Armed Bandit
使用 SB3 库的代理。
在我看来,这是一个简单得多的代理,但是查看他们说他们不涵盖那种算法的库文档,我想知道是否可以通过调整现有代理之一来创建类似的代理(没有轨迹解释) .
我的第一种方法是通过分配 的值来使用任何代理gamma=0
,但我认为这在数学上是不正确的。
解决方案
推荐阅读
- php - AWS Lambda 和 Symfony Bref - 部署 Symfony 4 网站
- function - 混合类/对象和函数:代码异味?
- python - 使用一个记录器和多个几乎相同的文件处理程序
- firebase - Firebase 安全规则:允许读取 + 写入除单个集合之外的所有内容
- javascript - JSX 中的多个 If 条件
- python - 有什么理由不使用自动提交吗?
- python - 散景图未嵌入 html
- android - 如何通过自定义 LayoutManager 在 recyclerview 中使用 snapHelper
- react-native - 错误提示“无法加载脚本。请确保您正在运行 Metro 服务器...”
- symfony - 增加内存限制 Composer 不起作用