nvidia-smi 无法初始化 NVML:GPU 访问被操作系统阻止

Posted

技术标签:

【中文标题】nvidia-smi 无法初始化 NVML:GPU 访问被操作系统阻止【英文标题】:nvidia-smi Failed to initialize NVML: GPU access blocked by the operating system 【发布时间】:2016-02-23 10:12:37 【问题描述】:

请求时

nvidia-smi

它给出了这个错误:

Failed to initialize NVML: GPU access blocked by the operating system

其他信息:

$ nvcc --verion

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2015 NVIDIA Corporation
Built on Mon_Feb_16_22:59:02_CST_2015
Cuda compilation tools, release 7.0, V7.0.27

还有:

 $ lspci | grep -i nvidia

 01:00.0 VGA compatible controller: NVIDIA Corporation GF108M [GeForce GT 425M] (rev a1)
 01:00.1 Audio device: NVIDIA Corporation GF108 High Definition Audio Controller (rev a1)

在互联网上搜索了很多,我找不到解决这个问题的方法。 当我使用 ipython notebook 并想运行 Caffe 框架时,它会出现此错误:

Check failed: error == cudaSuccess (38 vs. 0)  no CUDA-capable device is detected

【问题讨论】:

您没有正确安装CUDA(尤其是GPU驱动)。我建议关注directions。 @RobertCrovella 我遵循了所有这些指示,但在所有步骤中我收到的消息是:* 已经是最新版本。 0 升级,0 新安装,0 删除,0 未升级。例如对于 sudo apt-get install cuda 或 sudo apt-get install cuda-driver 和 sudo apt-get install linux-headers-$(uname -r) 【参考方案1】:

我注意到安装 CUDA 后重启 Ubuntu 可以工作,现在我看到了nvidia-smi 输出的 GPU 详细信息

【讨论】:

【参考方案2】:

如果您认为 CUDA 和图形驱动程序都已正确安装,但仍无法检测到您的 GPU,则问题可能在于您在 Optimus 上使用移动 Nvidia 显卡- 在 Linux 上启用笔记本电脑。

你可以:

更改您的应用程序以正确检测 Optimus 后面的 GPU。请参阅文档here 或通过Bumblebee(和primus)运行您的应用程序

【讨论】:

【参考方案3】:

这里是 WSL 用户。在 Windows 和 WSL 上运行 nvidia-smi 失败。在 Windows 端重新安装适用于 WSL 的 Nvidia 驱动程序,解决了该问题。该问题是在安装 CUDA Toolkit 时产生的,CUDNN 破坏了 Nvidia for WSL 驱动程序。

【讨论】:

今天的飞行后这仍然有效吗?更新到 build 21354 后,我今天开始收到 OP 的错误 这里也一样,刚刚安装了 build 21354 并且它停止工作了!【参考方案4】:

我遇到了同样的问题。这是因为安装了 nvidia 工具包(我不确定)。根据this website(有有用的想法) 我发现 cuda 安装程序和主机中的 cuda 驱动程序版本不兼容。 (host : 367.57 , installer: 375.26 , 起初我无法检查安装程序版本,因为所有版本都是367.57,但是当我通过运行文件重新安装cuda时,我找到了)

所以,我完全卸载了 cuda 和 nvidia,并通过 this help 再次安装 cuda。起初在安装过程中我发现了一些错误,nvidia 并没有完全消失。完全卸载后,我安装了cuda,现在我可以毫无问题地运行“sudo nvidia-smi”了。

【讨论】:

【参考方案5】:

我收到错误 failed to initialize NVML: Driver/Library version mismatch。而nvidia-smi 无法打印任何信息。我试图查找我的 ubuntu 中是否安装了其他版本的 nvidia 驱动程序。但我刚刚找到了 nvidia-driver-390。最后reboot帮我解决了问题。

【讨论】:

dmesg 在这种情况下会有所帮助。您将能够看到nvidia-smi 打印的详细错误

以上是关于nvidia-smi 无法初始化 NVML:GPU 访问被操作系统阻止的主要内容,如果未能解决你的问题,请参考以下文章

libnvidia-compute 更新后的 NVML 驱动程序/库不匹配 [关闭]

nvidia-smi:Failed to initialize NVML: Driver/library version mismatch

Azure DSVM/DLVM 上的 nvidia 错误

GPU学习随笔

Failed to initialize NVML: Unknown Error

nvidia-smi GPU性能测量没有意义