首页 > 解决方案 > gcloud dataproc clusters update - 如何删除阻止命令成功运行的挂起更新

问题描述

在我的 google dataproc 集群中,我尝试通过停用一个数据节点来动态调整集群的大小。使用工作人员数量执行集群更新,以将集群大小减少到 1 个主服务器和 5 个工作人员,但超过 2 小时未完成。

ERROR: (gcloud.dataproc.clusters.update) FAILED_PRECONDITION: Cannot update cluster 'my-cluster-dev' while it has other pending update operations.

我锁定了我的计算机并且不知何故丢失了命令外壳,因此集群仍然显示其处于更新状态,阻止我执行任何操作。我现在已经花了大约 5 个小时,仍然无法执行任何命令或访问集群。

gcloud dataproc clusters describe my-cluster-dev

projectId: my-project-id-dev
status:
  state: UPDATING
  stateStartTime: '2019-02-22T12:30:02.084Z'
statusHistory:

任何人都可以帮我解决让我的集群陷入更新状态的进程的方法,这样我就可以在集群上执行其他任务了吗?

标签: google-cloud-platformgcloudgoogle-cloud-dataproc

解决方案


您采取了哪些步骤来减少集群中的节点数量?目前尚不清楚“通过停用一个数据节点来动态调整集群大小”是什么意思。您是说当 my-cluster-dev 有 6 个节点并且它陷入更新状态时运行“gcloud dataproc clusters update my-cluster-dev --num-masters=1 --num-workers=5”还是有任何您执行的其他操作?


推荐阅读