首页 > 解决方案 > 主 Kubernetes 节点离线 GKE(多个集群和项目)

问题描述

今天早上,我们注意到所有项目中的所有 Kubernetes 集群(2 个项目,每个项目 2 个集群)在 Google Cloud Console 中显示不可用/错误。仪表板显示当前没有问题:https ://status.cloud.google.com/

基本上看起来主节点已关闭,API 没有响应,并且无法在 UI 中编辑集群。在周末之前,一切都已经好了,至少从昨天晚上开始,它们都显示为红色。

幸运的是,部署的服务可以响应,但我们无法以任何方式管理集群。我也在这里报道过:

https://issuetracker.google.com/issues/172841082

有没有其他人遇到过这种情况,有没有办法重启或触发主节点重启?我无法编辑集群,因此也无法升级。我在其他地方读到,只有来自 Google 的 SRE 人员才能(重新)启动它们。这超出了我的想象。

顺便说一句,自动修复设置为打开,我按照故障排除页面进行操作,基本上所有路径都指向:主节点关闭,无事可做。任何帮助将不胜感激,或者只是一个 SRE 执行启动节点操作;)。

标签: kubernetesgoogle-kubernetes-engine

解决方案


谢谢@dany L,这确实是一个计费问题。我很惊讶 Cloud Console 中没有任何消息,因此必须专门去结算部门才能了解这一点。计费解决后,集群可用之前需要几分钟,然后一切恢复正常。


推荐阅读