machine-learning - 处理生产中训练算法的多个 h2o api 调用的最佳方法是什么?
问题描述
我正在尝试构建一个 Web 应用程序,它允许用户上传数据集,选择他们选择的 h2o 算法并训练他们的数据集以构建模型。现在,如果多个用户同时访问服务器,h2o 开始并行处理请求(开始训练模型)。这增加了所有用户的培训时间。那么,在这种情况下我应该使用 h2o 的最佳方式是什么?我应该将这些请求保留在队列中并一一执行吗?(这会增加新用户的等待时间)
我在一个 50 MB 结构化和干净的数据集上运行了一个 GLM 模型进行分类。同时执行两个 api 调用(模型 1 和 2)几乎是我单独运行它(模型 3)时的两倍
解决方案
我会让他们排队。
此外,我每次都会从头开始重新启动 H2O 集群。
最后,我会从 python 或 R 驱动 H2O 集群。
推荐阅读
- wordpress - 当购物车总金额 = 0 时,应显示货到付款
- c# - 该类型不包括任何可访问的构造函数 WPF - 无窗口应用程序
- c++ - 使用线性探测插入哈希表
- phpword - 使用 PHPWord 添加纸张大小
- html - 如何在 dart 中使用 beautifulsoup scrape 从网页中获取特定元素
- java - 如何表示 Optional 类型的属性
在 OpenAPI 3 上 - sql - H2 嵌入式 DB LIMIT + OFFSET> Integer.MAX_VALUE 导致错误结果
- python - 如何以不同的时间安排间隔运行 subdags?
- elasticsearch - Ubuntu 18.04.2 LTS 上的 Elasticsearch:没有发布文件
- dependencies - 是否可以选择自动删除点图中的“冗余”边缘?