首页 > 解决方案 > 强化学习:代理 vs 网络 vs 模型 vs 策略

问题描述

不同的 RL 库和论文倾向于混淆这些术语:代理、网络、模型和策略。我正在尝试使用多代理 RL,每个代理使用多个网络,可能以分层方式。因此,我想事先澄清这些术语之间的区别。请阅读我目前对这些术语的理解,如果我理解正确,请告诉我。

我的理解如下:

我感谢任何帮助/评论。谢谢。

标签: deep-learningneural-networkreinforcement-learning

解决方案


推荐阅读