首页 > 解决方案 > gitlab-ci 服务中的 Nvidia 运行时

问题描述

我有一个加载 docker daemon docker 的服务,我想在该服务中使用 nvidia gpus,我创建了一个以 dockerd 作为入口点的图像并安装了 nvidia cuda 驱动程序,但是当我尝试部署我的应用程序以进行测试时,我是在服务映像中面临与 nvidia 驱动程序相关的错误

docker:来自守护进程的错误响应:OCI 运行时创建失败:container_linux.go:346:启动容器进程导致“process_linux.go:449:容器初始化导致”process_linux.go:432:运行预启动钩子 1 导致“运行钩子错误:退出状态 1,stdout: , stderr: nvidia-container-cli: 初始化错误: driver error: failed to process request\n\”””: 未知。

#image: chatzich/dinvidia
stages:
  - test
  - package

before_script:
  - echo "Before script section"

after_script:
  - echo "After script section"


test:
  image: chatzich/dinvidia
  services:
    - name: chatzich/dinvidia
      alias: dinvidia
  stage: build
  variables:
    DOCKER_HOST: tcp://dinvidia:2375
    DOCKER_DRIVER: overlay2
    DOCKER_TLS_CERTDIR: ""

  tags:
    - gpu

  script:
    # Build the production image
    - echo "Build stage script"
    - ldconfig -p | grep nvidia
    - docker --version
    - docker run --rm --runtime=nvidia nvidia/cuda ldconfig -p | grep nvidia


  stage: test

package:
  stage: package
  script:
    # Build the production image
    - echo "Package stage script"

标签: gitlab-cinvidianvidia-docker

解决方案


推荐阅读