尝试在 Ubuntu 18.04 上安装 CUDA 9.2

Posted

技术标签:

【中文标题】尝试在 Ubuntu 18.04 上安装 CUDA 9.2【英文标题】:Trying to install CUDA 9.2 on Ubuntu 18.04 【发布时间】:2019-01-18 05:49:27 【问题描述】:

我正在,遵循 this 网站:

我已经下载了 NVIDIA CUDA Toolkit(shell 脚本 cuda_9.2.88_396.26_linux),但是当我运行它时($sudo sh cuda_9.2.88_396.26_linux),我得到了:

Installing the NVIDIA display driver...
A system reboot is required to continue installation. Please reboot then run the installer again. 
An attmept has been made to disable Nouveau. 
If this message persists after reboot, please see the display driver log file at /var/log/nvidia-installer.log for more information.

所以,我重新启动并再次运行 shell 脚本 ($sudo sh cuda_9.2.88_396.26_linux),我得到了相同的消息。这就是 nvidia-installer.log 所说的:

 ERROR: The Nouveau kernel driver is currently in use by your system.  This driver is incompatible with the NVIDIA driver, and must be disabled before proceeding.  Please consult the NVIDIA driver README and your Linux distribution's documentation for details on how to correctly disable the Nouveau kernel driver.
WARNING: One or more modprobe configuration files to disable Nouveau are already present at: /etc/modprobe.d/nvidia-installer-disable-nouveau.conf.  Please be sure you have rebooted your system since these files were written.  If you have rebooted, then Nouveau may be enabled for other reasons, such as being included in the system initial ramdisk or in your X configuration file.  Please consult the NVIDIA driver README and your Linux distribution's documentation for details on how to correctly disable the Nouveau kernel driver.
-> For some distributions, Nouveau can be disabled by adding a file in the modprobe configuration directory.  Would you like nvidia-installer to attempt to create this modprobe file for you? (Answer: Yes)
-> One or more modprobe configuration files to disable Nouveau have been written.  For some distributions, this may be sufficient to disable Nouveau; other distributions may require modification of the initial ramdisk.  Please reboot your system and attempt NVIDIA driver installation again.  Note if you later wish to reenable Nouveau, you will need to delete these files: /etc/modprobe.d/nvidia-installer-disable-nouveau.conf
ERROR: Installation has failed.  Please see the file '/var/log/nvidia-installer.log' for details.  You may find suggestions on fixing installation problems in the README available on the Linux driver download page at www.nvidia.com.

我已经安装了我的 nvidia 驱动程序。

【问题讨论】:

也许你应该关注this。 【参考方案1】:

首先,我会遵循the official guide 包括预安装说明。通读每一行,如果你从一开始就彻底,你会节省时间。

“懒人工作两次”

第二:如果您遵循 Runfile 安装,以下是在 Ubuntu 中禁用 Nouveau 的说明。

    检查是否加载了 Nouveau 驱动程序。如果以下命令打印任何内容,则会加载 Nouveau 驱动程序

    $ lsmod | grep nouveau  
    

    在 /etc/modprobe.d/blacklist-nouveau.conf 创建一个文件,内容如下:

    blacklist nouveau
    options nouveau modeset=0
    

    重新生成内核initramfs:

    $ sudo update-initramfs -u
    

确保在完成后一直执行安装后操作。

最后:确保您正在使用的 Ubuntu 版本被您尝试安装的 CUDA 版本列为支持!!!!当我第一次安装时,我假设是最新的一切的版本都是最好的,但最新版本的 CUDA 不一定能在最新版本的 Ubuntu 上运行。一些更高级的用户可以让它工作,但我不能在那里指导你。检查 CUDA 工具包和 cuDNN 支持的版本(如果您正在使用它)。

祝你好运。安装 cuda 可能有点痛苦,有必要不要跳过任何安装步骤。 youtube 上还有一些有用的视频,如果您遇到困难,可能会有用。

【讨论】:

感谢您的回答!我刚刚安装了 Ubuntu (v. 18.04) 来运行我的 python 深度学习脚本。我找不到我应该在 Ubuntu 18.04 上使用的 CUDA 工具包版本(事实上,我在谷歌搜索时发现了许多不同的答案)。你推荐哪一个?如果我只是卸载 ubuntu 18.04 并安装 CUDA 官方支持的版本(如 ubuntu 17.10 或 16.04)会更容易吗? 是的。截至目前(2018 年 8 月 11 日)Cuda 工具包仅正式支持 17.10 和 16.04)我将对其中一个版本进行全新安装。此外,如果您打算使用 TensorFlow 进行深度学习,我将从官方推荐的版本开始。 CUDA 9.0 和 cuDNN 7.1。一旦你让这些工作,你可以尝试升级,如果你愿意(谷歌其他人如何修补它)但开始,我只会使用官方支持的版本。我试着只安装最新的东西,调试错误是一场噩梦。 如果你打算使用 python 和 TensorFlow 进行深度学习,windows 是最容易上手的环境,恕我直言。观看有关深度学习的 SentDex 视频以开始使用。如果您打算直接将 CUDA-C 和 C++ 直接连接到 GPU,那么请使用 Ubuntu,这样您就完全不必摆弄 Microsoft Visual Studio。如果您不确定从哪里开始,请查看 SentDex 和 Udacity。

以上是关于尝试在 Ubuntu 18.04 上安装 CUDA 9.2的主要内容,如果未能解决你的问题,请参考以下文章

在Ubuntu 18.04上安装Tensorflow

Ubuntu 18.04上CUDA 9.0cuDNN7.0及Tensorflow 1.8的安装

在 Ubuntu 上安装 Tensorflow GPU / CUDA

Ubuntu 18.04/20.04 CV环境配置(上):CUDA11.1 + cudnn安装配置

Ubuntu 18.04/20.04 CV环境配置(上):CUDA11.1 + cudnn安装配置

Ubuntu 18.04/20.04 CV环境配置(上):CUDA11.1 + cudnn安装配置