首页 > 解决方案 > Kubernetes 死节点感知

问题描述

K8s:1.18.18

不久前,我们遇到了这样一种情况,如果一个节点死亡并且 Pod 被部署到该节点,K8s 需要大约 15 分钟将在该节点上运行的 Pod 启动到一个新节点。

为了解决这个问题,我们的研究向我们指出了基于污点的驱逐和对 K8s API 的扩展,以提高“节点意识”。不幸的是,两者都不可靠。

有谁遇到过成功克服的吗?

蒂亚!

标签: kubernetes

解决方案


不幸的是,除了您提到的那些之外,没有其他内置解决方案。

您可以更改重新安排时间TaintBasedEvictions

    spec:
      tolerations:
      - key: "node.kubernetes.io/unreachable"
        operator: "Exists"
        effect: "NoExecute"
        tolerationSeconds: 2
      - key: "node.kubernetes.io/not-ready"
        operator: "Exists"
        effect: "NoExecute"
        tolerationSeconds: 2

另外,您可以将--pod-eviction-timeout节点上的标志设置为更短的值(默认为 5 分钟)。


推荐阅读