server - NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信。确保已安装并运行最新的 NVIDIA 驱动程序
问题描述
我有 Ubuntu 16.04 运行和 Nvidia 驱动程序和 CUDA 和 cud 很久以前安装。昨天服务器重新启动,通过ssh登录后,我想检查GPU使用nvidia-smi
但失败。
错误消息是“NVIDIA-SMI 已失败,因为它无法与 NVIDIA 驱动程序通信。确保已安装并运行最新的 NVIDIA 驱动程序。”
服务器有:
Ubuntu 16.04
Nvidia k80c x4
CUDA 9.0
有没有人遇到过这个问题并可以提供可能的解决方案?我真的不想重新安装驱动程序,因为它可能会导致其他问题。
解决方案
通过重新安装Nvidia GPU驱动程序最终解决了这个问题。这个错误的根本原因是因为使用GPU运行时由于电源不稳定导致服务器关闭。
推荐阅读
- javascript - 我可以通过 Google Fit REST API 获取有关我的步数的实时数据吗?
- php - 如何使用 Ajax 发布选择标签值到 PHP 中?
- ms-office - microsoft graph api 中的错误访问被拒绝以读取用户消息
- react-native - 如何在本机反应中隐藏组件
- sql - 我想将一个表中的行分配给另一个表中的行,这些行可以在 SQL oracle 中占用相同的行数
- java - 使用 proguard 时 Gson 嵌套类为空
- android - 我可以观察 Android App Process Priority 的变化吗?
- c# - “在执行`catch`块之前,运行时会检查`finally`块。”,这是什么意思?
- python-3.x - 如何在 pygame 中使这个按钮的图形更好?
- sql - 如何在sql server的一个存储过程中执行两个选择查询