kubernetes - Kubernetes Flannel k8s_install-cni_kube-flannel-ds 在工作节点上退出
问题描述
我正在设置我的第一个 Kubernetes 集群。我们期望混合使用 Windows 和 Linux 节点,所以我选择 flannel 作为我的 cni。我使用 RHEL 7.7 作为我的主节点,我有另外两台 RHEL 7.7 机器作为工作节点,然后剩下的是 Windows Server 2019。在大多数情况下,我遵循 Microsoft 网站上提供的文档:https ://docs.microsoft .com/en-us/virtualization/windowscontainers/kubernetes/getting-started-kubernetes-windows以及 Kubernetes 站点上的一个:https ://kubernetes.cn/docs/tasks/administer-cluster/kubeadm/adding-windows-nodes /。我知道 Microsoft 网站上的文章已有 2 年多的历史了,但这只是我找到的混合模式操作指南。
到目前为止,我已经在 Master 和 worker RHEL 节点上完成了以下操作:
- 停止并禁用firewalld
- 禁用 selinux
- 更新&&升级
- 禁用交换分区
- 为我的 Kubernetes 集群中涉及的所有节点添加了 /etc/hosts 条目
- 安装 Docker CE 19.03.11
- 安装 kubectl、kubeadm 和 kubelet 1.18.3(构建日期 2020-05-20)
- 为 Flannel 准备 Kubernetes 控制平面:
sudo sysctl net.bridge.bridge-nf-call-iptables=1
我现在已经在 RHEL 主节点上完成了以下操作
初始化集群
kubeadm init --pod-network-cidr=10.244.0.0/16 --service-cidr=10.96.0.0/12
kubectl 作为非 root 用户
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
为节点选择器修补守护程序集
wget https://raw.githubusercontent.com/Microsoft/SDN/master/Kubernetes/flannel/l2bridge/manifests/node-selector-patch.yml
kubectl patch ds/kube-proxy --patch "$(cat node-selector-patch.yml)" -n=kube-system
补丁后,kube-proxy 如下所示:
添加法兰绒
wget https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
修改 flannel 清单的 net-conf.json 部分,将 VNI 设置为 4096,将端口设置为 4789。它应该如下所示:
net-conf.json: |
{
"Network": "10.244.0.0/16",
"Backend": {
"Type": "vxlan",
"VNI" : 4096,
"Port": 4789
}
}
应用修改后的 kube-flannel
kubectl apply -f kube-flannel.yml
添加网络后,这是我在 kube-system 中获得的 pod
添加 Windows Flannel 和 kube-proxy DaemonSets
curl -L https://github.com/kubernetes-sigs/sig-windows-tools/releases/latest/download/kube-proxy.yml | sed 's/VERSION/v1.18.0/g' | kubectl apply -f -
kubectl apply -f https://github.com/kubernetes-sigs/sig-windows-tools/releases/latest/download/flannel-overlay.yml
加入工作节点 我现在正尝试通过执行 IU 初始化集群时生成的 kubeadm join 命令加入 RHEL 7.7 工作节点。工作节点初始化良好,如下所示:
当我转到我的 RHEL 工作节点时,我看到k8s_install-cni_kube-flannel-ds-amd64-f4mtp_kube-system容器已退出,如下所示:
- 如果我遵循正确的程序,你能告诉我吗?我相信 Flannel CNI 需要与 kubernetes 集群中的 pod 对话
- 如果 Flannel 难以设置为混合模式,我们可以使用其他可以工作的网络吗?
- 如果我们决定只使用 RHEL 节点,那么我可以安装而不遇到很多问题的最好和最简单的网络插件是什么?
谢谢,我很感激。
解决方案
官网有很多关于 Kubernetes 的资料,建议大家去看看:
我把这个答案分成几个部分:
- CNI
- 故障排除
CNI
什么是 CNI?
CNI(容器网络接口)是一个云原生计算基金会项目,由一个规范和库组成,用于编写插件以在 Linux 容器中配置网络接口,以及许多受支持的插件。CNI 只关心容器的网络连接以及在容器被删除时移除分配的资源。由于这个重点,CNI 得到了广泛的支持,并且规范易于实现。
简单来说,您的 CNI插件负责集群内的 pod 网络。
有多个 CNI 插件,例如:
- 绒布
- 印花布
- 穆尔图斯
- 织网
我的意思是,你不需要使用Flannel
. 您可以使用其他插件,例如Calico
. 主要考虑因素是它们彼此不同,您应该选择最适合您的用例的选项(例如支持某些功能)。
关于这个主题有很多材料/资源。请看一下其中的一些:
- Youtube.com:Kubernetes 和 CNI:我们在哪里以及下一步是什么 - Casey Callendrello,CoreOS
- Youtube.com:7 分钟解释容器网络接口 (CNI)
- Kubernetes.io:文档:概念:集群管理:网络
至于:
如果 Flannel 难以设置为混合模式,我们可以使用其他可以工作的网络吗?
如果您是指使用 Windows 和 Linux 机器节点的混合模式,我会坚持使用已经编写的指南,就像您提到的那样:Kubernetes.io:添加 Windows 节点
至于:
如果我们决定只使用 RHEL 节点,那么我可以安装而不遇到很多问题的最好和最简单的网络插件是什么?
选择 CNI 插件的最佳方法是寻找最适合您需求的解决方案。您可以点击此链接查看概览:
你也可以看这里(请记住,这篇文章来自 2018 年,可能已经过时):
故障排除
当我转到我的 RHEL 工作节点时,我看到 k8s_install-cni_kube-flannel-ds-amd64-f4mtp_kube-system 容器已退出,如下所示:
您的k8s_install-cni_kube-flannel-ds-amd64-f4mtp_kube-system
容器以状态退出,0
表明配置正确。
您可以通过调用以下命令来检查 flannel pod 的日志:
kubectl logs POD_NAME
也可以参考 Flannel 的官方文档:Github.com: Flannel: Troubleshooting
正如我在评论中所说:
要检查您的 CNI 是否正常工作,您可以在 2 个不同的节点上生成 2 个 pod 并尝试在它们之间建立连接(例如 ping 它们)。
脚步:
- 产卵荚
- 检查他们的 IP 地址
- 执行到 pod
- 平
产卵荚
下面是将生成 ubuntu pod的示例部署定义。它们将用于检查 pod 是否在节点之间进行通信:
apiVersion: apps/v1
kind: Deployment
metadata:
name: ubuntu
spec:
selector:
matchLabels:
app: ubuntu
replicas: 5
template:
metadata:
labels:
app: ubuntu
spec:
containers:
- name: ubuntu
image: ubuntu:latest
command:
- sleep
- infinity
请记住,此示例仅用于测试目的。应用上述定义:
kubectl apply -f FILE_NAME.yaml
检查他们的 IP 地址
生成 pod 后,您应该能够运行命令:
$ kubectl get pods -o wide
并查看与此类似的输出:
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
ubuntu-557dc88445-lngt7 1/1 Running 0 8s 10.20.0.4 NODE-1 <none> <none>
ubuntu-557dc88445-nhvbw 1/1 Running 0 8s 10.20.0.5 NODE-1 <none> <none>
ubuntu-557dc88445-p8v86 1/1 Running 0 8s 10.20.2.4 NODE-2 <none> <none>
ubuntu-557dc88445-vm2kg 1/1 Running 0 8s 10.20.1.9 NODE-3 <none> <none>
ubuntu-557dc88445-xwt86 1/1 Running 0 8s 10.20.0.3 NODE-1 <none> <none>
您可以从上面的输出中看到:
- 每个 pod 的 IP 地址是什么
- 每个 pod 分配了哪个节点。
通过上面的示例,我们将尝试在以下之间建立连接:
ubuntu-557dc88445-lngt7
(第一个)IP 地址10.20.0.4
在NODE-1上ubuntu-557dc88445-p8v86
(第三个) ip地址10.20.2.4
在NODE-2上
执行到 pod
您可以exec
进入 pod 运行命令:
$ kubectl exec -it ubuntu-557dc88445-lngt7 -- /bin/bash
请在此处查看官方文档:Kubernetes.io: Get shell running container
平
Ping 未内置到 ubuntu 映像中,但您可以使用以下命令安装它:
$ apt update && apt install iputils-ping
之后,您可以 ping 第二个 pod 并检查是否可以连接到另一个 pod:
root@ubuntu-557dc88445-lngt7:/# ping 10.20.2.4 -c 4
PING 10.20.2.4 (10.20.2.4) 56(84) bytes of data.
64 bytes from 10.20.2.4: icmp_seq=1 ttl=62 time=0.168 ms
64 bytes from 10.20.2.4: icmp_seq=2 ttl=62 time=0.169 ms
64 bytes from 10.20.2.4: icmp_seq=3 ttl=62 time=0.174 ms
64 bytes from 10.20.2.4: icmp_seq=4 ttl=62 time=0.206 ms
--- 10.20.2.4 ping statistics ---
4 packets transmitted, 4 received, 0% packet loss, time 3104ms
rtt min/avg/max/mdev = 0.168/0.179/0.206/0.015 ms
推荐阅读
- python - kivy 日历:如何在 BoxLayout 中插入 kivy 日历并在其按钮中设置功能
- android - 动画崩溃:错误:“this”不可用
- reactjs - 如何将上下文 api 与反应路由器 v4 一起使用?
- gcc - 如何编译单个 RabbitMQ C 示例 - 如何使用 gcc 正确链接到库
- visual-c++ - 如何更改 mfc 应用程序的背景属性
- asp.net - ASP.NET - 如何防止用户使用检查编辑 asp:CheckBox?
- javascript - 按下按钮时如何增加进度条的值javascript
- python - 工作日作为使用 statsmodels 的线性回归模型中的虚拟/因子变量
- java - Java 代码无法解析从包装脚本传递的命令行参数
- javascript - 将 JavaScript NPM 项目与 Spring Boot 融合