首页 > 解决方案 > 集群重启后 Kubernetes 命名空间消失

问题描述

我们有一个 6 节点的 K8s kubernetes 集群,其中 Rancher 在 AWS 上运行。集群已关闭并启动,集群恢复正常,但它已恢复到旧状态并且缺少一些新的命名空间,有没有办法恢复命名空间和与之相关的 Pod。

谢谢,

标签: amazon-web-serviceskubernetesnamespacesrebootrancher

解决方案


如果您已在 AWS 上使用Kops实现 Kubernetes 集群,则可以Kops通过指定export KOPS_STATE_STORE=s3://yourstatestore环境变量从 S3 存储桶中恢复集群的最后状态,该存储桶也存储其状态,请查看此链接以获取更多信息。

但是,请记住,Kops只能恢复 Kubernetes 集群的一般配置,因此内部资源(DeploymentsPodsNamespaces等)不包含在此恢复列表中。

因此,您可以考虑使用etcd 数据存储备份。例如,使用etcdctl命令行工具并定期创建etcd数据存储的快照。

此外,您可以考虑使用heptio/ark实用程序来管理灾难恢复事件,特别是针对 Kubernetes 集群资源和持久卷。


推荐阅读