首页 > 解决方案 > 无法在 H2O 中运行并行网格搜索

问题描述

我正在尝试使用 H2O 网格搜索的新“并行”选项来调整具有 3 折交叉验证的 GBM 模型的超参数。但是,一旦构建了第一批模型,搜索就会失败,或者更确切地说只是停止。

一点上下文:我正在将此网格搜索作业提交到 hadoop 上远程服务器上的 H2O 集群。我正在创建具有 5 个节点的集群。这是一个例子:hadoop jar /usr/local/h2o/bin28/h2odriver.jar -nodes 5 -mapperXmx 30g -baseport 54364 -disown。我有一个折叠分配的指示列。

使用parallelism = 0,网格搜索从 5 个并行模型开始(首先每个模型有 2 个 cv 模型,然后是完成后的第 3 个 cv 模型)。一旦这 5 个模型完成,搜索就完成了。

如果我在关闭并行性的情况下按顺序运行网格搜索,它可以正常工作,但我不知道为什么它不能与并行性一起工作。

我将不胜感激。谢谢!

编辑:更正 - 看起来“parallelism = 1”选项也不起作用。搜索仅在一个模型后停止。这不是以前版本的 H2O - v3.26.03 的问题。

标签: parallel-processingh2ogrid-searchgridsearchcv

解决方案


推荐阅读