首页 > 解决方案 > 如何在多层结构中规划一条既最短又最高奖励的路径?

问题描述

我想听听你对某事的看法。我们有一个网格。这个网格中的每个像素都有不同的奖励值。我想要的是在从起点到目的地的过程中走最短路径并收集高点。这两者能同时实现吗?强化学习算法适合这个吗?其实我还有第二个问题。我想要的另一件事是在层之间进行路径规划。所以想象一下堆叠的碎片,每一个都是一个网格。我想通过从一层移动到另一层来到达目标点。有什么资源可以推荐给我吗?太感谢了。

标签: searchpathnavigationreinforcement-learningplanning

解决方案


推荐阅读