sequence - 如何为强化学习找到好的观察结果?
问题描述
我从学习 RL 开始,想知道如何处理无法表示状态(隐藏)的观察特征?
是否有一些系统的方法或一些指导方针来说明人们希望特征向量的样子?离散,维度,马尔可夫属性,嵌入质量......?
我想处理机器操作数据流,实际上有很多直接测量和许多高维度特征向量(也是流)。
非常感谢您的输入。
解决方案
推荐阅读
- xml - 始终在 Visual Studio Code 中打开编码为 ISO 8859-15 的“.fvl”(即 xml)类型的文件
- java - 应用程序不应该尝试从 OutOfMemory 中恢复吗?
- r - 在 NAMESPACE 中声明了 S3 方法,但在 R 中找不到
- reactjs - Typescript - 在 React 回调中自动继承 props 类型
- angular - 如何验证本地存储中是否已存在电子邮件
- java - java maven 存储库库 - 搜索库以根据 json 响应值创建字典
- javascript - 在反应本机上覆盖android上的webview的onCreateInputConnection
- vba - 将访问报告导出为按分组值分隔的 pdf
- python - 将字典转换为特定格式
- php - 获取我的数组 $_POST['tableFields'] 的第一个元素