python - 如何部署 Q-learning 模型？

首页 > 解决方案 > 如何部署 Q-learning 模型？

问题描述

我正在尝试熟悉强化学习。我使用 Q-learning 方法创建了一个 RL。

问题描述

我有一组客户，他们每个人都有以下特征[价格，类别，集群] - 这些客户代表状态
有 10 种动作的范围可以改变多少价格 - 例如 [0.9, 0.8, 0.7, 0.6, 0.5, 1, 1.2, 1.5, 1.7, 1.9] - 使用一些概率可以确定当使用 Q 函数应用新价格。
我能够创建和训练算法，但现在假设我想在生产中使用它。我的想法如下，作为输入，我想使用状态 [价格、类别、集群]，作为输出，我想为给定的客户获得最佳操作。我也认为一旦你得到客户的回应，更新模型，给模型新的奖励是很重要的。

我试图找到一些如何保存和使用 Q-learning 功能以及如何使用更新新数据的示例，但到目前为止我没有看到任何示例。任何人都可以就如何部署和更新 Q-learning 模型提出一些示例或一些解释吗？

标签： pythondeploymentq-learning

解决方案

推荐阅读