reinforcement-learning - 使用强化学习模型ddpg时,输入数据为序列数据
问题描述
使用强化学习模型ddpg时,输入数据为序列数据、高维(21维)状态和低维(1维)动作。这对模型的训练有什么负面影响吗?如何解决
解决方案
一般来说,在任何机器学习场景中,维度本身都不是问题,主要取决于输入数据有多少可变性。当然,高维数据比低维数据具有更高的可变性。
即使考虑到这一点,也可以通过向 ML 算法提供更多数据并增加允许表示的复杂性(即神经网络中的更多节点和/或层)来“轻松”解决问题。
在 RL 中,这甚至不是什么问题,因为您对实际拥有的数据量并没有真正的限制。你总是可以在环境中运行你的代理,以获得更多的样本轨迹来训练。您可能会在这里发现的唯一问题是您的计算时间会增加很多(取决于您需要在环境中训练多少才能解决这个问题)。
推荐阅读
- uitableview - SAPUI5:如何向 ui.table 的列菜单添加自定义功能?
- apache-kafka - 当集群中的 4 个代理中有 3 个代理时,kafka 主题创建失败
- javascript - 在页面加载时默认显示内容?
- apache-spark - 如何在 PySpark 中创建具有偏移量的 DStream(使用 KafkaUtils.createDirectStream)?当kafka是集群时?
- python - 迁移错误'没有迁移应用'也没有在 django 的 postgresql 中添加表
- apache-camel - 如何在apache骆驼的URL中使用“移动”时重命名文件
- jquery - 如何水平滚动要放置在右侧的 div?
- java - Java-无法将 1000 批插入表中
- c++ - 解决产生无限循环的数组问题时遇到问题
- emacs - Emacs Diary 的 diary-float 查询