首页 > 解决方案 > KubeFlow 端到端(谷歌云)

问题描述

我正在尝试按照 codelab https://codelabs.developers.google.com/codelabs/cloud-kubeflow-e2e-gis/#1创建一个集群

但是当我运行命令时出现错误kfctl apply platform

错误 [0045] 更新 kubeflow-qwiklab 错误:&{Code:RESOURCE_ERROR 位置:/deployments/kubeflow-qwiklab/resources/kubeflow-qwiklab 消息:{"ResourceType":"gcp-types/container-v1beta1:projects.locations.clusters " ,"ResourceErrorCode":"400","ResourceErrorMessage":{"code":400,"message":"没有找到前缀为 \"1.11\" 的有效版本。","status":"INVALID_ARGUMENT"," statusMessage":"错误请求","re​​questPath":" https://containe r.googleapis.com/v1beta1/projects/qwiklabs-gcp-cb63974aba9fe7b6/locations/us-central1-a/clusters","httpMethod":"POST"}} ForceSendFields:[] NullFields:[]} filename="gcp/ gcp.go:278" 错误:无法应用 KfApp:(kubeflow.error):代码 500,消息:协调器应用 gcp 失败:(kubeflow.error):代码 400,消息:gcp 应用无法更新部署管理器错误无法更新 cluster-kubeflow.yaml:更新 kubeflow-qwiklab 错误(400):错误请求用法:kfctl apply [all(=default)|k8s|platform] [flags] 标志:-h,--help 应用帮助-V,--verbose 详细输出默认为 false 无法应用 KfApp:(kubeflow.error):代码 500 带有消息:协调器为 gcp 应用失败:(kubeflow.error):代码 400 带有消息:gcp apply 无法更新部署管理器错误无法更新集群 ter-kubeflow.yaml:更新 kubeflow-qwiklab 错误(400):错误请求

标签: google-cloud-platform

解决方案


通过 kfctl 设置 GKE Kubeflow 后收到相同的错误。

https://github.com/kubeflow/examples/tree/master/videos/from_zero_to_kubeflow

也使用相同的版本(v0.5.1)。尚未深入研究问题发生的位置,但使用最新版本(v0.6.2)为我解决了这个错误。 https://github.com/kubeflow/kubeflow/releases/tag/v0.6.2


推荐阅读