python - google ai 平台上的超参数调优错误:“replica master 0 exited with a non-zero status of 1”
问题描述
在谷歌云 AI 平台上训练深度学习模型时,使用超参数调整(我的超参数配置信息在 YAML 文件中),我收到此错误:
Hyperparameter Tuning Trial #2 Failed before any other successful trials were completed.
The failed trial had parameters: batch_size=11, learning_rate=3.527059074944887e-05, .
The trial's error message was: The replica master 0 exited with a non-zero status of 1
由于错误消息有点笼统,我很难理解问题可能出在哪里。
我的 YAML 配置文件:
trainingInput:
hyperparameters:
goal: MINIMIZE
maxTrials: 2
maxParallelTrials: 2
hyperparameterMetricTag: loss
enableTrialEarlyStopping: FALSE
params:
- parameterName: batch_size
type: INTEGER
minValue: 8
maxValue: 16
scaleType: UNIT_LINEAR_SCALE
- parameterName: learning_rate
type: DOUBLE
minValue: 0.00001
maxValue: 0.0001
scaleType: UNIT_LINEAR_SCALE
解决方案
推荐阅读
- julia - 无法在 Julia 1.4 中安装 YStockData.jl
- .net-core - 为什么在编译 .NET Core 控制台应用程序时我们会同时得到 dll 和 exe 文件?
- python - Pycharm:没有为 tkinter 配置 python
- kotlin - 密封类与现有类?
- javascript - Javascript:将 JQuery 等 CDN 从 HTML 文件中移出?
- prolog - Prolog 从集合中获得最大收益
- javascript - 如何在 Rails 中向全日历事件 url 添加 id?
- node.js - 在 Google Functions 中使用 child_process.exec 非常缓慢且随机
- node.js - 如何将对象从续集传递到车把部分?
- firebase - Firebase Firestore:如何按集合监控读取文档计数?