parallel-processing - 无法在 H2O 中运行并行网格搜索
问题描述
我正在尝试使用 H2O 网格搜索的新“并行”选项来调整具有 3 折交叉验证的 GBM 模型的超参数。但是,一旦构建了第一批模型,搜索就会失败,或者更确切地说只是停止。
一点上下文:我正在将此网格搜索作业提交到 hadoop 上远程服务器上的 H2O 集群。我正在创建具有 5 个节点的集群。这是一个例子:hadoop jar /usr/local/h2o/bin28/h2odriver.jar -nodes 5 -mapperXmx 30g -baseport 54364 -disown
。我有一个折叠分配的指示列。
使用parallelism = 0
,网格搜索从 5 个并行模型开始(首先每个模型有 2 个 cv 模型,然后是完成后的第 3 个 cv 模型)。一旦这 5 个模型完成,搜索就完成了。
如果我在关闭并行性的情况下按顺序运行网格搜索,它可以正常工作,但我不知道为什么它不能与并行性一起工作。
我将不胜感激。谢谢!
编辑:更正 - 看起来“parallelism = 1”选项也不起作用。搜索仅在一个模型后停止。这不是以前版本的 H2O - v3.26.03 的问题。
解决方案
推荐阅读
- entity-framework - EntityFramework 似乎在 AccountController 中缓存服务
- javascript - Three.js 中的模态弹出窗口没有响应
- python - 将一些 JSON 键转换为 Python 对象
- google-maps - Google 是否提供了他们在 Places API 中拥有的所有城市的导出功能?
- java - ESC / POS - 如何使用辅助字体打印图像?
- javascript - 使用相同的表格更新添加的数据 | 反应
- sql - 将多个数据库查询合二为一
- python - 验证 SFTP 放置操作
- excel-formula - 使用 sumproduct 和 countifs 查找符合条件的唯一值
- c++ - 如何在 Windows 中捕获 HDR 帧缓冲区?