首页 > 解决方案 > consul 在 asia-south1(孟买)地区的谷歌 Kubernetes 引擎上部署时不断崩溃,但在其他地区工作

问题描述

我有创建 google kubernetes 引擎的 terraform 脚本,在这个集群上部署 consul (bitnami),然后将一些键值插入到 consul KV 存储中。

这个 terraform 脚本在我尝试过的各个区域都可以正常工作,除了 asia-south1 区域(印度孟买)。在 asia-south1 区域中,consul 从未初始化并不断崩溃,容器每隔几分钟就会重新启动。我可以在 StackDrive 日志中看到以下错误。

[ERR] agent: failed to sync remote state: No cluster leader\n"

[ERR] agent: Coordinate update error: No cluster leader\n"

[ERR] http: Request GET /v1/operator/raft/configuration, error: No cluster leader from=127.0.0.1:39314\n"

我怀疑 asia-south1 数据中心的底层基础设施几乎没有差异。有没有人遇到过这个问题?

标签: google-kubernetes-engineconsul

解决方案


我检查了谷歌云状态仪表板,看看它是否报告了 asia-south1 区域的任何中断或其他问题,但我没有发现任何可能导致此问题的异常行为。

由于操作是独一无二的,因为它们跨越所有三个范围:全球资源、区域操作和区域操作,那么如果您的 terraform 脚本在各个区域都可以正常工作,那么它在 asia-south1 区域也应该可以正常工作。有时一个地区没有足够的资源,所以你会有一些限制。

如果您能够复制该行为,要对此问题进行更多调查,我们需要访问您的项目,然后请通过创建技术案例(免费用户此链接)联系 GCP 支持或使用 Google Cloud 将其报告为缺陷平台的问题跟踪器

stackdriver 中的错误日志可能与 pod 错误有关,这个 kubernetes 官方文档可能会有所帮助。


推荐阅读