search - 如何在多层结构中规划一条既最短又最高奖励的路径?
问题描述
我想听听你对某事的看法。我们有一个网格。这个网格中的每个像素都有不同的奖励值。我想要的是在从起点到目的地的过程中走最短路径并收集高点。这两者能同时实现吗?强化学习算法适合这个吗?其实我还有第二个问题。我想要的另一件事是在层之间进行路径规划。所以想象一下堆叠的碎片,每一个都是一个网格。我想通过从一层移动到另一层来到达目标点。有什么资源可以推荐给我吗?太感谢了。
解决方案
推荐阅读
- ios - Pod 安装:找不到“Foo”的规范
- db2 - 如何在 DB2 中查找查询表的所有对象
- python - 如何通过多个条件过滤变量
- angular - Angular FormArray 中的唯一项目名称验证器
- docker - docker服务和docker容器的区别
- c# - 添加到列表
带有 foreach 循环 - syntax-highlighting - 将 ini 文件的 Atom 编辑器语法高亮显示为 Java 属性
- filter - Scale2ref 然后使用 ffmpeg 加入两个视频剪辑
- c# - 在逻辑应用程序中运行时出现 Azure 函数 404 错误
- java - 无法使用 Spring Boot 在 jax rs 中显示 index.html