首页 > 解决方案 > 无法从所有节点远程登录 K8S ClientIP 服务

问题描述

当我尝试在集群中公开服务时,我正在努力使用 K8S 网络。特别是我需要部署一个私有容器注册表(通过 K8S)并将其公开为 clusterIP 服务。

为了做到这一点,我遵循了这篇文章

目前我不需要任何特定的卷,我只想在集群内公开服务。

这是 POD yml 文件:

apiVersion: v1
kind: Pod
metadata:
  name: registry
  labels:
    app: registry
  namespace: default
spec:
  containers:
  - name: registry
    image: registry:2
    imagePullPolicy: Always
    ports:
      - containerPort: 5000

虽然这是我的服务文件:

---
kind: Service
apiVersion: v1
metadata:
  name: registry
  namespace: default
spec:
  selector:
    app: registry
  ports:
    - port: 5000
      targetPort: 5000

这两个对象都是通过kubectl create -f <FILE_NAME>

这些是我暴露的服务

NAME         TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)    AGE
kubernetes   ClusterIP   10.43.0.1       <none>        443/TCP    55m
registry     ClusterIP   10.43.198.164   <none>        5000/TCP   10m

虽然这是我的服务描述列表

Name:              kubernetes
Namespace:         default
Labels:            component=apiserver
                   provider=kubernetes
Annotations:       <none>
Selector:          <none>
Type:              ClusterIP
IP:                10.43.0.1
Port:              https  443/TCP
TargetPort:        6443/TCP
Endpoints:         172.31.5.173:6443
Session Affinity:  ClientIP
Events:            <none>


Name:              registry
Namespace:         default
Labels:            <none>
Annotations:       <none>
Selector:          app=registry
Type:              ClusterIP
IP:                10.43.198.164
Port:              <unset>  5000/TCP
TargetPort:        5000/TCP
Endpoints:         10.42.1.4:5000
Session Affinity:  None
Events:            <none>

当我telnet 10.43.198.164 5000在部署 pod 的同一个节点上运行时,一切正常,而如果我在另一个节点(它是一个 2 节点集群)中启动它,该命令仍然是附加的。

节点是 CentOS 7 的 AWS ec2 实例

Kubernetes 在 1.8.3 版本下,通过 RANCHER RKE 部署

我发现了这个问题的几个问题,但没有任何东西可以帮助我调查这个问题。

在这里您可以找到用于实例化集群的 RKE 配置文件

#{{ ansible_managed }}

nodes:
  - address: node1
    user: user
    role: [controlplane,worker,etcd]
    ssh_key_path: path
  - address: node2
    user: user
    role: [worker]
    ssh_key_path: path

ignore_docker_version: false

kubernetes_version: v1.10.1
network:
  plugin:flannel

有什么帮助吗?谢谢。

标签: amazon-web-serviceskubernetesrancher

解决方案


我不认为这个问题与 docker 注册表有关。看起来它在网络层。

调试问题:

  • 你用什么CNI插件?
  • 你能直接到达 pod ( telnet 10.42.1.4 5000) 吗?
  • 您的节点 ( kubectl get nodes) 和系统 pod ( kubectl -n kube-system get pods) 准备好了吗?

推荐阅读