首页 > 解决方案 > Kubernetes api 服务器偶尔不可用

问题描述

您好,我正在管理一个使用 Kops 创建的 Kubernetes 集群。我最近更新了 Kubernetes1.9.9并对集群执行了滚动更新。一切似乎都很顺利,除了出现了一个新的烦人问题:

我的 Kubernetes api 服务器以非常零星的意外方式变得不可用。有时它会变得无法访问几分钟,有时半小时。然后,如果您再试一次,它会奇迹般地再次起作用。这让我很难使用 Kubernetes 集群。有谁知道为什么这些错误消息不断弹出?

Unable to connect to the server: net/http: TLS handshake timeout

The connection to the server api.xxx.io was refused - did you specify the right host or port?

标签: kuberneteskops

解决方案


当@justinsb 指出我正确的方向时,我在kubernets/kops github 存储库上发布了同样的问题。他建议通过 ssh 进入主节点并docker ps查看所有容器是否稳定。

我认为这样做是我的 apiserver 容器不断崩溃。这就是让我得出结论的原因,即我的主节点可能没有足够的计算能力来处理所有请求。我将主 ec2 实例从t2.microto更改t2.medium为问题消失了。


推荐阅读