首页 > 解决方案 > 使用不同的命令重新启动 Kubernetes 作业或 Pod

问题描述

我正在寻找一种从命令行快速运行/重新启动 Job/Pod 并覆盖要在创建的容器中执行的命令的方法。

对于上下文,我有一个 Kubernetes 作业,它作为我们部署过程的一部分被执行。有时该作业会崩溃,我需要在作业创建的容器内运行某些命令来调试和修复问题(随后的作业会成功)。

到目前为止,我这样做的方式是:

这是非常乏味的。我正在寻找一种方法来执行以下操作

kubectl restart job/foobar --command "tail -f /dev/null"

# or even better
kubectl run job/foobar --exec --interactive bash

我无法使用该run命令创建 Pod:

kubectl run --image xxx -ti

因为我尝试重新启动的作业具有volumeMounts我需要重用的某些和其他配置。所以我需要类似的东西kubectl run --from-config job/foobar


有没有办法实现这一点,还是我坚持使用 YAML 定义文件?


编辑:Job YAML 看起来大约。像这样:

apiVersion: batch/v1
kind: Job
metadata:
    name: database-migrations
    labels:
        app: myapp
        service: myapp-database-migrations
spec:
    backoffLimit: 0
    template:
        metadata:
            labels:
                app: myapp
                service: myapp-database-migrations
        spec:
            restartPolicy: Never
            containers:
                - name: migrations
                  image: registry.example.com/myapp:977b44c9
                  command:
                      - "bash"
                      - "-c"
                      - |
                          set -e -E
                          echo "Running database migrations..."
                          do-migration-stuff-here
                          echo "Migrations finished at $(date)"
                  imagePullPolicy: Always
                  volumeMounts:
                      -   mountPath: /home/example/myapp/app/config/conf.yml
                          name: myapp-config-volume
                          subPath: conf.yml
                      -   mountPath: /home/example/myapp/.env
                          name: myapp-config-volume
                          subPath: .env
            volumes:
                - name: myapp-config-volume
                  configMap:
                      name: myapp
            imagePullSecrets:
                -   name: k8s-pull-project

标签: kuberneteskubectlkubernetes-jobs

解决方案


您建议的命令不存在。查看此参考资料,您可以在其中找到所有可用的命令。

根据该文档, Job的任务是创建一个或多个 Pod 并继续重试执行它们,直到达到指定数量的成功终止的 Pod。然后Job跟踪成功的完成。您不能只更新作业,因为这些字段不可更新。要做你想做的事,你应该删除当前的工作并再次创建一个。


我建议您将所有配置保存在文件中。如果您在配置作业命令时遇到问题,实践表明您应该在 yaml 中修改这些设置并应用于集群 - 如果您的部署崩溃 - 通过将配置存储在文件中,您就有了备份。

如果您对如何改进此任务感兴趣,可以尝试下面描述的这 2 个示例:

首先,我创建了几个文件:

示例作业(job.yaml):

apiVersion: batch/v1
kind: Job
metadata:
  name: test1
spec:
  template:
    spec:
      containers:
      - name: test1
        image: busybox
        command: ["/bin/sh", "-c", "sleep 300"]
        volumeMounts:
        - name: foo
          mountPath: "/script/foo"
      volumes:
      - name: foo
        configMap:
          name: my-conf
          defaultMode: 0755
      restartPolicy: OnFailure

patch-file.yaml

spec:
  template:
    spec:
      containers:
      - name: test1
        image: busybox
        command: ["/bin/sh", "-c", "echo 'patching test' && sleep 500"]

configmap.yaml

apiVersion: v1
kind: ConfigMap
metadata:
  name: my-conf
data:
  test: |
    #!/bin/sh
    echo "skrypt test"

  1. 如果你想自动化这个过程,你可以使用plugin

插件是一个独立的可执行文件,其名称以kubectl-. 要安装插件,请将其可执行文件移动到PATH.

不需要插件安装或预加载。kubectl插件可执行文件从二进制文件接收继承的环境。插件根据其名称确定它希望实现的命令路径。

这是可以替换您的工作的文件

插件根据其文件名确定它将实现的命令路径。

kubectl-job

#!/bin/bash
kubectl patch -f job.yaml -p "$(cat patch-job.yaml)" --dry-run=client -o yaml | kubectl replace --force -f - && kubectl wait --for=condition=ready pod -l job-name=test1 && kubectl exec -it $(kubectl get pod -l job-name=test1 --no-headers -o custom-columns=":metadata.name") -- /bin/sh

这个命令使用了一个额外的文件(patch-job.yaml见这个链接)——我们可以在其中放置我们的更改job

然后你应该改变这个文件的权限并移动它:

sudo chmod +x .kubectl-job
sudo mv ./kubectl-job /usr/local/bin

这一切都完成了。现在你可以使用它了。

$ kubectl job
job.batch "test1" deleted
job.batch/test1 replaced
pod/test1-bdxtm condition met
pod/test1-nh2pv condition met
/ #

如您所见Job,已被替换(删除和创建)。


  1. 您也可以使用单行命令,示例如下:
kubectl get job test1 -o json | jq "del(.spec.selector)" | jq "del(.spec.template.metadata.labels)" | kubectl patch -f - --patch '{"spec":  {"template":  {"spec":  {"containers": [{"name": "test1", "image": "busybox", "command": ["/bin/sh", "-c",  "sleep 200"]}]}}}}' --dry-run=client -o yaml | kubectl replace --force -f -

使用此命令,您可以“手动”更改作业输入参数。这是输出:

job.batch "test1" deleted
job.batch/test1 replaced

如您所见,此解决方案也有效。


推荐阅读