kubernetes - 恢复 Rancher 时出错:此集群当前不可用;在 API 准备好之前,与它直接交互的区域将不可用
问题描述
我正在尝试备份和恢复牧场主服务器(单节点安装),如此处所述。
备份后,我尝试关闭rancher服务器节点,并在新节点上运行一个新的rancher容器(在同一网络,但另一个IP地址),然后我使用备份文件恢复。
恢复后,我登录到rancher UI,它显示以下错误:
所以,我检查了牧场主服务器的日志,它显示如下:
2019-10-05 16:41:32.197641 http:来自 127.0.0.1:38388 的 TLS 握手错误:EOF 2019-10-05 16:41:32.202442 I | http:来自 127.0.0.1:38380 的 TLS 握手错误:EOF 2019-10-05 16:41:32.210378 I | http:来自 127.0.0.1:38376 的 TLS 握手错误:EOF 2019-10-05 16:41:32.211106 I | http:来自 127.0.0.1:38386 的 TLS 握手错误:EOF 2019/10/05 16:42:26 [错误] ClusterController c-4pgjl [user-controllers-controller] 失败:无法启动集群 c-4pgjl 的用户控制器:无法联系服务器:获取https://192.168.94.154:6443/api/v1/namespaces/kube-system?timeout=30s:等待集群代理连接 2019/10/05 16:44:34 [错误] ClusterController c-4pgjl [user-controllers-controller] 失败:无法启动集群 c-4pgjl 的用户控制器:无法联系服务器:获取https://192.168.94.154:6443/api/v1/namespaces/kube-system?timeout=30s:等待集群代理连接 2019/10/05 16:48:50 [错误] ClusterController c-4pgjl [user- controllers-controller] 失败:无法启动集群 c-4pgjl 的用户控制器:无法联系服务器:获取https://192.168.94.154:6443/api/v1/namespaces/kube-system?timeout=30s:等待集群代理连接 2019-10-05 16:50:19.114475 I | mvcc: store.index: 紧凑 75951 2019-10-05 16:50:19.137825 I | mvcc:在 75951 完成预定的压缩(耗时 22.527694 毫秒)2019-10-05 16:55:19.120803 I | mvcc:store.index:紧凑 76282 2019-10-05 16:55:19.124813 I | mvcc:在 76282 完成预定的压缩(耗时 2.746382 毫秒)
之后我查看了master节点的日志,发现rancher代理仍然尝试连接旧的rancher服务器(旧的ip地址),而不是新的,所以集群不可用。
我怎样才能解决这个问题?
解决方案
您需要使用以下步骤在 Rancher 中重新注册节点。
- 通过转到 Global -> Settings -> server-url 更新 Rancher 中的 server-url 这应该是带有 https:// 的完整 URL
- 然后使用这个脚本在 Rancher 中重新注册节点https://github.com/mattmattox/cluster-agent-tool
推荐阅读
- c - struct statx 可以在内核中使用吗?
- javascript - 虚拟 DOM 的真正含义是什么?
- android - 如果设备有软(虚拟)导航按钮,谷歌地图上的 getCameraPosition 错误?
- java - 不推荐使用 Fragment prev 如何更改此代码 Android Studio
- bash - bash grep 复杂搜索
- python - 如何使用 python 3 从 arduino 获取模拟值?
- c# - 尝试在 Unity 3D 中创建进入球体的对象变换列表
- c++ - 在opengl中将二维纹理应用于具有z方向变化的单个立方体面
- javascript - 我想学javascript
- javascript - 如何在表格正方形中制作单元格