首页 > 解决方案 > 如何在图上设置强化学习问题?

问题描述

我是深度 RL 的新手,并试图设置问题(定义环境、操作等)并选择合适的算法。我有一个加权的有向图,表示为邻接矩阵:

G = [
    [0.3, 1.5, 0, 0.9],
    [20.1, 0, 0, 0],
    [0, 7.0, 9.0, 0],
    [0.9, 1.7, 10.2, 0]
]

我希望我的代理遍历节点,它将states包括每个节点。应该是每个.in-connectionsout-connectionsactions(-inf, inf)state

从 RL 的角度来看,可以解决这个问题的算法是什么?如何设置状态和动作以输入神经网络?(一个问题是某些节点可能有更多的边,而 NN 通常是固定的输入大小)。每对的奖励state, action是已知的。

标签: pythonmachine-learningreinforcement-learning

解决方案


推荐阅读