首页 > 解决方案 > 处理生产中训练算法的多个 h2o api 调用的最佳方法是什么?

问题描述

我正在尝试构建一个 Web 应用程序,它允许用户上传数据集,选择他们选择的 h2o 算法并训练他们的数据集以构建模型。现在,如果多个用户同时访问服务器,h2o 开始并行处理请求(开始训练模型)。这增加了所有用户的培训时间。那么,在这种情况下我应该使用 h2o 的最佳方式是什么?我应该将这些请求保留在队列中并一一执行吗?(这会增加新用户的等待时间)

我在一个 50 MB 结构化和干净的数据集上运行了一个 GLM 模型进行分类。同时执行两个 api 调用(模型 1 和 2)几乎是我单独运行它(模型 3)时的两倍

标签: machine-learningdeep-learningdata-scienceh2o

解决方案


我会让他们排队。

此外,我每次都会从头开始重新启动 H2O 集群。

最后,我会从 python 或 R 驱动 H2O 集群。


推荐阅读