首页 > 解决方案 > 尝试在 Google Cloud AI Platform 上使用 scikit-learn 训练模型时作业失败

问题描述

使用Google提供的教程,我设法通过 Cloud Shell 成功提交了培训应用程序,但很快就失败了。

我试过使用空白.py文件,只是想看看这是否导致了问题,但我得到了完全相同的错误消息。

ENV按照教程中所示设置变量后,我运行以下命令:

gcloud ai-platform jobs submit training $JOB_NAME \
  --job-dir $JOB_DIR \
  --package-path $TRAINING_PACKAGE_PATH \
  --module-name $MAIN_TRAINER_MODULE \
  --region $REGION \
  --runtime-version=$RUNTIME_VERSION \
  --python-version=$PYTHON_VERSION \
  --scale-tier $SCALE_TIER

作业提交成功:

Job [sklearn_training_20190823_131024] submitted successfully.
Your job is still active. You may view the status of your job with the command

  $ gcloud ai-platform jobs describe sklearn_training_20190823_131024

or continue streaming the logs with the command

运行命令以流式传输日志后,我收到以下错误消息:

回溯(最后一次调用):文件“/usr/lib/python2.7/runpy.py”,第 163 行,在 _run_module_as_main mod_name,_Error)文件“/usr/lib/python2.7/runpy.py”,行119,在 _get_module_details code = loader.get_code(mod_name) File "/usr/lib/python2.7/pkgutil.py",第 283 行,在 get_code self.code = compile(source, self.filename, 'exec') 文件“/root/.local/lib/python2.7/site-packages/scikit_training3/trial.py”,第 1 行未找到 ^ SyntaxError:无效语法

标签: pythongoogle-cloud-platformscikit-learn

解决方案


我设法解决了这个问题:问题是从 GitHub 获取训练 .py 文件的“curl”命令(如教程中所示)实际上并未下载该文件。相反,我使用了 '''git clone''' 命令。


推荐阅读