首页 > 解决方案 > Mesosphere DC/OS 服务部署错误

问题描述

我有一个工作的 Docker 容器,带有 CUDA Version: 11.2.0,我想将它部署在我们集群的 GPU 节点上。GPU的Nvidia驱动程序最近已更新为驱动程序版本:470.57.02 CUDA版本:11.4

我知道它正在工作,因为它在开发 GPU 上进行了测试,但是在 DC/OS 上部署时,任务失败,并显示以下错误消息:

状态 TASK_FAILED 消息无法启动容器:无法复制设备“/dev/nvidia-caps”:无法获取源开发:不是特殊文件:/dev/nvidia-caps

仅在 CPU 上部署时,它就像一个魅力。

你以前遇到过这个错误,有什么解决方法吗?

标签: mesospheredcosnvidia-docker

解决方案


推荐阅读