首页 > 解决方案 > 如何部署 Q-learning 模型?

问题描述

我正在尝试熟悉强化学习。我使用 Q-learning 方法创建了一个 RL。

问题描述

  1. 我有一组客户,他们每个人都有以下特征[价格,类别,集群] - 这些客户代表状态
  2. 有 10 种动作的范围可以改变多少价格 - 例如 [0.9, 0.8, 0.7, 0.6, 0.5, 1, 1.2, 1.5, 1.7, 1.9] - 使用一些概率可以确定当使用 Q 函数应用新价格。
  3. 我能够创建和训练算法,但现在假设我想在生产中使用它。我的想法如下,作为输入,我想使用状态 [价格、类别、集群],作为输出,我想为给定的客户获得最佳操作。我也认为一旦你得到客户的回应,更新模型,给模型新的奖励是很重要的。

我试图找到一些如何保存和使用 Q-learning 功能以及如何使用更新新数据的示例,但到目前为止我没有看到任何示例。任何人都可以就如何部署和更新 Q-learning 模型提出一些示例或一些解释吗?

标签: pythondeploymentq-learning

解决方案


推荐阅读