keras - Google AI Platform 上的所有超调试验都失败了
问题描述
我想在 Google AI Platform 上启动一项培训工作,使用自定义容器进行一些超参数调整。我在这里阅读了文档。具体来说,我对我的代码进行了以下调整:
- 在我的 Dockerfile 中,我安装了 cloudml-hypertune。
- 在我的训练代码中:我使用 cloudml-hypertune 通过调用其帮助函数 report_hyperparameter_tuning_metric 来报告每个试验的结果。我为每个超参数添加了命令行参数,并使用 argparse 处理参数解析。
- 在我的工作请求中,我向我的 TrainingInput 对象添加了一个 HyperparameterSpec,其名称与我使用的 report_hyperparameter_tuning_metric 函数匹配
从日志中我可以看到每次试验都没有错误地完成,但在作业控制台视图中我可以看到以下内容:
请注意,指标列 (recall@k) 或训练步骤中没有任何内容。我打印了我的指标只是为了看看它是否有一些价值,答案是肯定的。我的 Keras 代码如下:
model.fit(...)
recall_at_k = evaluate(model)
hpt = hypertune.HyperTune()
hpt.report_hyperparameter_tuning_metric(hyperparameter_metric_tag='recall@k', metric_value=recall_at_k, global_step=args.epochs)
解决方案
推荐阅读
- fork - 使用 sigaction 停止子循环并拦截 Ctrl*C 时出现问题
- jquery - 仅允许文本框上的字母,即使用户使用 jQuery 复制+粘贴不起作用
- python - python3 shell模式可以输出一些字节的utf-8字符,而不能输出其他一些字节,这是什么原因?
- node.js - GET 请求 401(未经授权)
- c# - 如何根据兄弟节点的值获取 XML 节点?
- sql-server - 两个 (SELECT TOP 1 +1 ) 语句和两个 INSERTS 同时
- c++ - 如何在 sdl2 中阻止线性矩形运动口吃
- javascript - React Failed prop type: value without onChange handler
- asp.net - Word VBA / 宏在服务器 Application.Run、ASP.NET、DCOM 上运行
- flask - Flask-PyMongo 查询数据库