mesosphere - Mesosphere DC/OS 服务部署错误
问题描述
我有一个工作的 Docker 容器,带有 CUDA Version: 11.2.0,我想将它部署在我们集群的 GPU 节点上。GPU的Nvidia驱动程序最近已更新为驱动程序版本:470.57.02 CUDA版本:11.4
我知道它正在工作,因为它在开发 GPU 上进行了测试,但是在 DC/OS 上部署时,任务失败,并显示以下错误消息:
状态 TASK_FAILED 消息无法启动容器:无法复制设备“/dev/nvidia-caps”:无法获取源开发:不是特殊文件:/dev/nvidia-caps
仅在 CPU 上部署时,它就像一个魅力。
你以前遇到过这个错误,有什么解决方法吗?
解决方案
推荐阅读
- tensorflow - tensorflow 1.10 中的 tf.FixedLenFeature、tf.VarLenFeature 和 tf.FixedLenSequenceFeature 有什么区别
- google-chrome - 如何在 Chrome 中手动添加 chrome 自动完成记录?
- charts - Google 折线图中的虚线基线
- python - 与基于 DCT 的隐写术相关的问题
- angular - 无法在浏览器上执行 PUT 方法
- flutter - Flutter 和 Hive 的奇怪问题
- image-processing - TypeError:将光栅文件转换为 csv 文件时无法解压不可迭代的 NoneType 对象
- python - 给定组中的最大值,逐行递增
- reactjs - 如何使 Styled 组件通用以接收参数?
- html - 如何使表格边框位于背景线性/径向渐变(滚动阴影)后面