首页 > 解决方案 > 当 Pod 数量很高时,Kubernetes 仪表板没有响应

问题描述

在使用 Deployment 安排大量 Pod(超过 1000 个)之前,Kubernetes Dashboard 可以正常工作。

运行多个 Pod 时,尝试单击仪表板中的任何页面时出现以下错误:
Error: 'dial tcp <ip>:9090: getsockopt: connection refused' Trying to reach: 'http://<ip>:9090/api/v1/workload/default?itemsPerPage=10&page=1'

增加主节点的规格有帮助吗?

我在想主节点无法处理网络负载?

更新:
可能是相关的,但我不确定,当我在许多中型实例而不是一些非常大的实例上运行集群(我正在使用kops)时,这个问题减少了(我得到这个错误页面更少)。 似乎每个节点上的 Pod 控制器(或任何你称之为的)无法处理这么多的 Pod,因为一个非常高规格的节点上有很多 Pod,而一个中等大小的节点上安排的 Pod 较少。

标签: amazon-ec2kuberneteskopskubernetes-dashboard

解决方案


看起来 kubernetes-dashboard pod 确实缺乏资源。可能的解决方案是在专用节点或资源消耗较少的节点上运行 kubernetes-dashboard pod。

污点亲和力特征可能有助于实现这一目标。


推荐阅读