首页 > 解决方案 > 机器学习算法建议

问题描述

我想在 ML 中试验一些新事物。我使用了很多 GA 来解决复杂的问题,但现在我想尝试一些新的东西。

我的问题很简单:我有 3/4 个不同大小的对象和一个放置对象的包裹。目标是估计正确的包裹内容。

现在我已经使用一个存储所有先前数据(知识)的表解决了这个问题,并返回与输入数据更接近的结果。从形式上讲,它可以工作并从过去学习,但它是 ML 吗?

我希望该软件了解如何将对象存储在包裹中。

我需要什么算法?

我已经用GA解决了这个问题。

此致

标签: machine-learning

解决方案


我敢打赌,强化学习 (RL) 就是您要找的。它不会像 GA 那样直接开始。您可能必须创建自己的环境。

您的操作可能是从包裹中放置/移除物体。如果猜测正确,您可以定义奖励(+ 值),如果猜测错误,您可以定义负奖励。从而为多个剧集训练算法。

我怀疑你可以通过 Q 学习轻松解决这个问题。考虑到问题的简单性,您宁愿选择 Q 表方法而不是 DQN(深度 Q 网络)。

RL 最适合用于优化任务,这个问题刚开始就很好。我还用 GA 和 RL 解决了优化任务,但你当然会觉得 RL 有一些“智能”。

本文通过一个工作示例对 RL 进行了清晰的概述。

openAI gym是一个让 RL 程序员的生活变得轻松的库。

您可以像这样创建自定义环境。并定义如何分配奖励以及如何找到下一个状态等。


推荐阅读