development-environment - OpenAI-Gym 中的自定义环境
问题描述
我想在 Python 中尝试强化学习。但我想用我自己的状态和奖励创建一个自定义环境。
可能我想在这个中使用时间序列数据(虽然不像股票)。我希望我的系统在给定环境的情况下根据时间学习行为。
所以我首先要创建一个自定义环境,有人可以帮助我吗?
解决方案
推荐阅读
- python - 如何在 Python 中将两个二维数组组合成以下数组?
- javascript - 防止返回上一页的按钮 - angularjs
- javascript - Javascript在javascript中序列化表单变量
- php - Symfony 组织
- raspberry-pi - raspberrypi smartthings-mqtt-bridge 自动启动不工作
- asp.net-core - 是否可以从 swagger 生成后台 API?
- vba - 调用 Sub 导致 Sub undefined 错误
- java - Spring Boot 项目由于 Schema-validation 无法运行:缺少序列 [hibernate_sequence]
- unity3d - Unity 打不开文件
- docker - Artifactory Pro 中损坏的 docker 图像