首页 > 解决方案 > 如何为强化学习找到好的观察结果?

问题描述

我从学习 RL 开始,想知道如何处理无法表示状态(隐藏)的观察特征?

是否有一些系统的方法或一些指导方针来说明人们希望特征向量的样子?离散,维度,马尔可夫属性,嵌入质量......?

我想处理机器操作数据流,实际上有很多直接测量和许多高维度特征向量(也是流)。

非常感谢您的输入。

标签: sequencereinforcement-learning

解决方案


推荐阅读