首页 > 解决方案 > NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信。确保已安装并运行最新的 NVIDIA 驱动程序

问题描述

我有 Ubuntu 16.04 运行和 Nvidia 驱动程序和 CUDA 和 cud 很久以前安装。昨天服务器重新启动,通过ssh登录后,我想检查GPU使用nvidia-smi但失败。

错误消息是“NVIDIA-SMI 已失败,因为它无法与 NVIDIA 驱动程序通信。确保已安装并运行最新的 NVIDIA 驱动程序。”

服务器有:
Ubuntu 16.04
Nvidia k80c x4
CUDA 9.0

有没有人遇到过这个问题并可以提供可能的解决方案?我真的不想重新安装驱动程序,因为它可能会导致其他问题。

标签: server

解决方案


通过重新安装Nvidia GPU驱动程序最终解决了这个问题。这个错误的根本原因是因为使用GPU运行时由于电源不稳定导致服务器关闭。


推荐阅读