首页 > 解决方案 > Pod 状态失败的原因

问题描述

如果 Pod 的状态是Failed,Kubernetes 会尝试创建新的 Pod 直到它到达terminated-pod-gc-thresholdin kube-controller-manager。这将在集群中留下许多FailedPod,需要清理。

Evicted除了会导致 Pod之外,还有其他原因Failed吗?

标签: kuberneteskubeletkube-controller-manager

解决方案


POD 状态为 的原因可能有很多FAILED。您只需要通过运行命令检查问题(如果存在)

kubectl -n <namespace> describe pod <pod-name>

仔细检查EVENTS列出了在 POD 创建期间发生的所有事件的部分。希望您可以从那里查明失败的原因。

但是,POD 故障有多种原因,其中一些原因如下:

  • 用于 POD 的图像错误。
  • 错误的命令/参数被传递到 POD。
  • Kubelet 无法检查 POD 活跃度(即活跃度探测失败)。
  • POD 健康检查失败。
  • 网络 CNI 插件问题(用于网络的 CNI 插件配置错误)。


例如:

由于图像拉取错误,pod 失败

在上面的示例中,无法提取图像“not-so-busybox”,因为它不存在,因此 pod 无法运行。pod 状态和事件清楚地描述了问题。


推荐阅读