reinforcement-learning - 我应该实施一个智能奖励代理吗...?
问题描述
所以基本上,我正在尝试设置一个 AI 代理来学习如何使用 Tensor-force 和 pyautogui 控制鼠标移动。我希望这个代理很好奇并且能够对环境中的不同事物做出反应。我是否应该实施一个单独的代理来控制给予第一个代理的奖励,并根据第一个代理的行为给所述第二个代理随机奖励,或者张量力中是否已经存在代理好奇心?我注意到在 Tensor-force 的库中提到了一些关于 action_exploration 的事情,但我真的不明白它应该做什么......
解决方案
推荐阅读
- anylogic - deleteSelf() 中的错误:代理应该属于某个群体
- python - 如何让 discord.py 机器人通过控制台向特定频道发送消息
- yocto - Yocto中图像和包目录有什么区别
- java - Java SSL - 使用 pkcs12 (.p12) 文件连接到安全的 Rest 服务
- python - 如何将字符串附加到列表中的元组?
- angular - 动态组件不适用于 formarray angular
- javascript - 半年日期格式
- node.js - 错误:DPI-1047:在 NodeJS 中找不到 64 位 Oracle 客户端库
- react-native - 如何使用博览会后台服务 Location.startLocationUpdatesAsync() 保持更新位置,即使对象不移动,
- python - 我在 google colab 中遇到了与权限相关的问题