machine-learning - 机器学习算法建议
问题描述
我想在 ML 中试验一些新事物。我使用了很多 GA 来解决复杂的问题,但现在我想尝试一些新的东西。
我的问题很简单:我有 3/4 个不同大小的对象和一个放置对象的包裹。目标是估计正确的包裹内容。
现在我已经使用一个存储所有先前数据(知识)的表解决了这个问题,并返回与输入数据更接近的结果。从形式上讲,它可以工作并从过去学习,但它是 ML 吗?
我希望该软件了解如何将对象存储在包裹中。
我需要什么算法?
我已经用GA解决了这个问题。
此致
解决方案
我敢打赌,强化学习 (RL) 就是您要找的。它不会像 GA 那样直接开始。您可能必须创建自己的环境。
您的操作可能是从包裹中放置/移除物体。如果猜测正确,您可以定义奖励(+ 值),如果猜测错误,您可以定义负奖励。从而为多个剧集训练算法。
我怀疑你可以通过 Q 学习轻松解决这个问题。考虑到问题的简单性,您宁愿选择 Q 表方法而不是 DQN(深度 Q 网络)。
RL 最适合用于优化任务,这个问题刚开始就很好。我还用 GA 和 RL 解决了优化任务,但你当然会觉得 RL 有一些“智能”。
本文通过一个工作示例对 RL 进行了清晰的概述。
openAI gym是一个让 RL 程序员的生活变得轻松的库。
您可以像这样创建自定义环境。并定义如何分配奖励以及如何找到下一个状态等。
推荐阅读
- email - 将 RoundCube 中的邮件和文件夹批量导出到 Thunderbird
- python - 在循环浏览目录时需要一些帮助来解决 Python 中的 DBF“找不到文件”错误?
- java - OpenGL filtering parameters and mipmap
- javascript - 如何安全地使用 setTimout 和 useEffect 中的 refs?
- javascript - 跨域请求被阻止:同源策略不允许在 javascript 中读取远程资源(原因:CORS 请求不是 http)
- elasticsearch - ELK - 在logstash中定义的日期在kibana中显示为字符串
- java - Android不调用第一种方法/跳过第一种方法
- javascript - 通过(PHP)从网页中提取 JavaScript 值
- spring - Thymeleaf th:onclick 事件 - 调用确认函数
- css - CSS li a:visited 覆盖移动设备上的悬停状态