python - 尝试在 Google Cloud AI Platform 上使用 scikit-learn 训练模型时作业失败
问题描述
使用Google提供的教程,我设法通过 Cloud Shell 成功提交了培训应用程序,但很快就失败了。
我试过使用空白.py
文件,只是想看看这是否导致了问题,但我得到了完全相同的错误消息。
ENV
按照教程中所示设置变量后,我运行以下命令:
gcloud ai-platform jobs submit training $JOB_NAME \
--job-dir $JOB_DIR \
--package-path $TRAINING_PACKAGE_PATH \
--module-name $MAIN_TRAINER_MODULE \
--region $REGION \
--runtime-version=$RUNTIME_VERSION \
--python-version=$PYTHON_VERSION \
--scale-tier $SCALE_TIER
作业提交成功:
Job [sklearn_training_20190823_131024] submitted successfully.
Your job is still active. You may view the status of your job with the command
$ gcloud ai-platform jobs describe sklearn_training_20190823_131024
or continue streaming the logs with the command
运行命令以流式传输日志后,我收到以下错误消息:
回溯(最后一次调用):文件“/usr/lib/python2.7/runpy.py”,第 163 行,在 _run_module_as_main mod_name,_Error)文件“/usr/lib/python2.7/runpy.py”,行119,在 _get_module_details code = loader.get_code(mod_name) File "/usr/lib/python2.7/pkgutil.py",第 283 行,在 get_code self.code = compile(source, self.filename, 'exec') 文件“/root/.local/lib/python2.7/site-packages/scikit_training3/trial.py”,第 1 行未找到 ^ SyntaxError:无效语法
解决方案
我设法解决了这个问题:问题是从 GitHub 获取训练 .py 文件的“curl”命令(如教程中所示)实际上并未下载该文件。相反,我使用了 '''git clone''' 命令。
推荐阅读
- r - 用顺序数据替换数据框中的非顺序数据(重复唯一值)
- botframework - 当 LUIS 应用程序连接到 Web 应用程序机器人时,无法识别添加到 LUIS 应用程序的新自定义意图
- debugging - 尝试设置调试后弄乱了lua路径
- html - 动画 CSS 标记不适用于 ID,0% 到 100%
- python - numpy.einsum 的输出形状
- r - 获取从 S3 类及其父类继承的方法
- lua - 如何修复'尝试调用方法'addMoney'(一个零值)'错误?
- c# - Display1 无摄像机渲染
- reactjs - 从 API 中提取的格式日期 - React
- python - 过滤数据 - 数据结构和预测算法