kubernetes - 主 Kubernetes 节点离线 GKE(多个集群和项目)
问题描述
今天早上,我们注意到所有项目中的所有 Kubernetes 集群(2 个项目,每个项目 2 个集群)在 Google Cloud Console 中显示不可用/错误。仪表板显示当前没有问题:https ://status.cloud.google.com/
基本上看起来主节点已关闭,API 没有响应,并且无法在 UI 中编辑集群。在周末之前,一切都已经好了,至少从昨天晚上开始,它们都显示为红色。
幸运的是,部署的服务可以响应,但我们无法以任何方式管理集群。我也在这里报道过:
https://issuetracker.google.com/issues/172841082
有没有其他人遇到过这种情况,有没有办法重启或触发主节点重启?我无法编辑集群,因此也无法升级。我在其他地方读到,只有来自 Google 的 SRE 人员才能(重新)启动它们。这超出了我的想象。
顺便说一句,自动修复设置为打开,我按照故障排除页面进行操作,基本上所有路径都指向:主节点关闭,无事可做。任何帮助将不胜感激,或者只是一个 SRE 执行启动节点操作;)。
解决方案
谢谢@dany L,这确实是一个计费问题。我很惊讶 Cloud Console 中没有任何消息,因此必须专门去结算部门才能了解这一点。计费解决后,集群可用之前需要几分钟,然后一切恢复正常。
推荐阅读
- c# - c#如何通过LINQ查询数据表
- amazon-web-services - 我们可以保留从 ec2 到 lightsail 的静态 ip
- url - 自定义 SCIM URL 的限制
- c# - 将回调方法转换为任务
- java - 当我与 String 的相等元素进行比较时出了什么问题
- kubernetes - 无法理解 DeploymentStatus 中的 availableReplicas、readyReplicas、availableReplicas
- python - Pygame每次我添加一个矩形它都会偏移它
- javascript - 遍历一个数字数组并在没有两个循环的情况下执行“数字”次?
- laravel - Laravel 资源路由参数未覆盖
- java - 执行器服务被卡住,不抛出错误