machine-learning - 强化学习迷你高尔夫游戏
问题描述
我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏。
- 我想为游戏引擎提供输入(角度和力)。
- 得到球的最终位置。
- 根据最终排名计算奖励。
- 迭代过程直到成功。
我想我可以通过使用贪婪方法或函数逼近来实现这一点。我想知道这是否可能,并想找到一个类似的例子。
解决方案
在文献中,强化学习是最接近人工智能的东西,所以是的,你可以将它应用到这个迷你高尔夫游戏中。
以下是布局:
状态:球场上球的位置(x、y、z)
动作:角度、力
奖励:球到洞的距离
根据您的领域有多大,这个问题应该很容易解决。
我想我可以通过使用贪婪方法或函数逼近来实现这一点。
您肯定希望至少使用一种电子贪婪方法来促进早期剧集中的探索。
为了简化问题,我会先考虑 2D,甚至可能是 1D 案例,以便您熟悉算法。
对于 1D 情况,您的状态将是您的球所在的位置。你的动作是施加在球上的力的大小。奖励可以基于你的球离球门柱的距离。
如果你愿意,我可以为你编写这个环境。
推荐阅读
- python - Querying SQLite Database for specific cell
- sql - 在 Postgres 的联接表中按列对行进行排序
- r - 为 K 骰子模拟 N 次掷骰而苦苦挣扎
- c# - 如何在 .netframework API 中使用 OAuth 2.0 On-Behalf-Of
- java - 从 DateTime 类 Joda api 中查找最新的时间戳
- node.js - 如何在不同于“/”的路径中部署 Ganttlab
- asp.net-core - 用户重新验证页面.net core
- flutter - Drawer 仅适用于 AppBar,但不适用于自定义 App Bar
- cmake - CMake如何访问不同文件夹中的头文件和源文件
- aws-lambda - Step Function 可以每秒处理 500 次执行吗?