python - 如何在图上设置强化学习问题?
问题描述
我是深度 RL 的新手,并试图设置问题(定义环境、操作等)并选择合适的算法。我有一个加权的有向图,表示为邻接矩阵:
G = [
[0.3, 1.5, 0, 0.9],
[20.1, 0, 0, 0],
[0, 7.0, 9.0, 0],
[0.9, 1.7, 10.2, 0]
]
我希望我的代理遍历节点,它将states
包括每个节点。应该是每个.in-connections
out-connections
actions
(-inf, inf)
state
从 RL 的角度来看,可以解决这个问题的算法是什么?如何设置状态和动作以输入神经网络?(一个问题是某些节点可能有更多的边,而 NN 通常是固定的输入大小)。每对的奖励state, action
是已知的。
解决方案
推荐阅读
- javascript - 为什么我的函数没有从最里面的 then()/catch() 承诺返回值?
- c++ - 如何检查 Openacc 是否运行良好?
- winapi - 我对 PE 文件重定位感到困惑
- python - 如何强制 tensorflow 和 Keras 在 GPU 上运行?
- python - Python 模拟异步对象 w。PyTest
- python - 列出不删除值
- php - php遍历数组得到对应的值
- dart - 我可以在 Dart 中调用泛型类型的静态方法吗?
- knitr - Knitr / RMarkdown (Beamer) 中的 LaTeX 数学表达式
- npm - 'npm install &>/dev/null' 和 'npm install --silent' 和 'npm install --quiet' 之间的内部功能区别是什么?