首页 > 解决方案 > 我应该实施一个智能奖励代理吗...?

问题描述

所以基本上,我正在尝试设置一个 AI 代理来学习如何使用 Tensor-force 和 pyautogui 控制鼠标移动。我希望这个代理很好奇并且能够对环境中的不同事物做出反应。我是否应该实施一个单独的代理来控制给予第一个代理的奖励,并根据第一个代理的行为给所述第二个代理随机奖励,或者张量力中是否已经存在代理好奇心?我注意到在 Tensor-force 的库中提到了一些关于 action_exploration 的事情,但我真的不明白它应该做什么......

标签: reinforcement-learningpyautogui

解决方案


推荐阅读