python - 如何部署 Q-learning 模型?
问题描述
我正在尝试熟悉强化学习。我使用 Q-learning 方法创建了一个 RL。
问题描述
- 我有一组客户,他们每个人都有以下特征[价格,类别,集群] - 这些客户代表状态
- 有 10 种动作的范围可以改变多少价格 - 例如 [0.9, 0.8, 0.7, 0.6, 0.5, 1, 1.2, 1.5, 1.7, 1.9] - 使用一些概率可以确定当使用 Q 函数应用新价格。
- 我能够创建和训练算法,但现在假设我想在生产中使用它。我的想法如下,作为输入,我想使用状态 [价格、类别、集群],作为输出,我想为给定的客户获得最佳操作。我也认为一旦你得到客户的回应,更新模型,给模型新的奖励是很重要的。
我试图找到一些如何保存和使用 Q-learning 功能以及如何使用更新新数据的示例,但到目前为止我没有看到任何示例。任何人都可以就如何部署和更新 Q-learning 模型提出一些示例或一些解释吗?
解决方案
推荐阅读
- php - 在 Carbon 解析中没有得到正确的日期
- dynamic-data - 请求自定义路由文件时动态更改数据库
- python - 如何使用“--no-binary”编写 requirements.txt 文件?
- visual-studio-code - VSCode 终端进程命令启动失败
- powershell - Powershell下载并执行exe文件
- angular - 使用服务层 HttpTestingController 进行 Angular 单元测试错误:预计未找到打开的请求 GET
- html - 如何使背景图像填充 div 并做出响应
- c# - 无法初始化模拟类的成员
- css - Laravel DataTables 基于值的颜色单元格?
- angular - 面临在 Json 值中为名称查找 id 的问题