Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题

Posted Karen-CXZ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题相关的知识,希望对你有一定的参考价值。

Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题

安装的步骤以及出现的问题

软硬件信息:
操作系统:Ubuntu20.04
显卡:GeForce RTX 3090

(小菜鸟装两台电脑踩过的所有坑)

一、安装Nvidia驱动

  1. 根据显卡型号3090,到官网下载驱动:
    自己下载的版本是:
    NVIDIA-Linux-x86_64-470.94.run
  2. 禁用nouveau
    打开终端,输入:
sudo gedit /etc/modprobe.d/blacklist.conf 

在blacklist.conf文件末尾加上

blacklist nouveau

并保存。
然后执行:

sudo update-initramfs -u   //应用更改

重启电脑:

reboot

验证是否禁用nouvea

lsmod | grep nouveau

若没有信息返回说明已经禁用

  1. 安装NVIDIA驱动:
    打开terminal卸载旧版本NVIDIA驱动:
sudo apt-get remove –purge nvidia*

给驱动run文件赋予执行权限:

sudo chmod a+x NVIDIA-Linux-x86_64-470.94.run

安装:

sudo ./NVIDIA-Linux-x86_64-470.94.run -no-x-check -no-nouveau-check -no-opengl-files

安装过程出现的问题:
问题一:

出现unable to find the development tool cc的问题:
解决方法:
sudo apt-get update
sudo apt-get install gcc

安装完gcc之后继续执行安装的命令:

sudo ./NVIDIA-Linux-x86_64-470.94.run -no-x-check -no-nouveau-check -no-opengl-files

问题二:

出现unable to find the development tool make的问题:
解决方法:
sudo apt-get update
sudo apt-get install ubuntu-make
sudo apt-get install make

安装完make之后继续执行安装的命令:

sudo ./NVIDIA-Linux-x86_64-470.94.run -no-x-check -no-nouveau-check -no-opengl-files

安装过程中出现的选项:

选择Ignore CC version check继续


选择OK继续

Install NVIDIA’s 32-bit compatibility libraries?
选择No继续

Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
选择 Yes

最后,输入nvidia-smi
查看NVIDIA版本检验是否安装成功

二、安装CUDA

  1. 官网下载符合自己电脑的cuda版本
    最后一项Installer Type建议选择runfile[local],因为更方便一些。

    这里,我下载的是:cuda_11.4.0_470.42.01_linux.run

  2. 安装
    下载好之后,输入:

sudo sh cuda_11.4.0_470.42.01_linux.run


输入accept回车:

这个地方不要下载Driver,因为之前已经安装完了
取消选择的方法是:光标停留在Driver那一行上,然后回车,使[]里的X消失
选择install回车

看到上边的页面,则安装完毕

  1. 验证是否安装成功
cat /usr/local/cuda/version.txt

若没有这个文件,则在该文件夹下看看是否有version.json

有的话输入则输入:cat /usr/local/cuda/version.json


4. 设置环境变量

gedit ~/.bashrc

加入环境变量:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

保存并退出,终端运行:

source ~/.bashrc
  1. 查看是否安装成功:
    终端运行:
nvcc -V


显示上述文字则代表安装成功。

(在安装另一台机子配置环境时出现了nvcc fatal: nvcc fatal:Failed to preprocess host compiler properties的问题:

解决方法如下:
在终端输入:

sudo apt-get install build-essential

再运行nvcc -V则成功

三、安装cuDNN

  1. 进入官网进行注册
  2. 下载CUDA对应的cuDNN版本
    CUDA11.4下载的安装包:
  3. 解压
tar -xzvf cudnn-11.4-linux-x64-v8.2.4.15.tgz 
  1. 将相关文件复制到CUDA路径
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
  1. 重建软链接
cd /usr/local
sudo rm -rf cuda  //删除之前创建的软链接
sudo ln -s cuda-11.4 cuda  //重建软链接

四、安装conda

  1. 官网下载
    找到最下边找到下图界面,根据自己所需要的版本进行下载:

    我下载的是:Anaconda3-2021.11-Linux-x86_64.sh
  2. 安装
    打开终端,执行下列命令:
bash Anaconda3-2021.11-Linux-x86_64.sh


按回车继续安装

输入yes回车继续

按回车确认安装位置:/home/虚拟机名称/anaconda3

输入yes,继续

出现类似界面,则代表Anaconda3已经安装成功。

  1. 查看是否安装成功
    最后可以输入conda list查看(重新打开一个终端):

五、安装 ssh

  1. 安装
sudo apt-get install sshd
  1. 查看是否安装
ssh -V
  1. 开启ssh服务
sudo service ssh start
  1. 查看ssh是否开启
sudo ps -e |grep ssh

(sshd如果只显示一个,则表明没有开启ssh服务)

解决方法:

sudo apt-get install openssh-server
ssh -V
sudo service ssh start
sudo ps -e |grep ssh


开启成功
5. 安装ssh服务器

sudo apt install openssh-server
  1. 安装ssh客户端
sudo apt install openssh-client
  1. 配置ssh客户端
    终端运行:
sudo gedit /etc/ssh/ssh_config

去掉PasswordAuthentication yes前面的#号,保存并退出

  1. 配置ssh服务器
    终端运行:
sudo gedit /etc/ssh/sshd_config

把PermitRootLogin prohibit-password改成PermitRootLogin yes,保存退出:

9. 重启ssh服务

sudo /etc/init.d/ssh restart

出现Restarting ssh (via systemctl):ssh.service.则安装成功:

六、解决向日葵无法连接的问题

  1. 安装并登陆好Ubuntu的向日葵客户端
    在终端执行以下命令:
sudo apt-get update
sudo apt-get grade
sudo apt-get install lightdm
  1. 切换lightdm图形页面
sudo dpkg-reconfigure lightdm
  1. 重启
reboot

一台机子完全成功,可以顺利连接向日葵。

  1. 在另一台机子上出现的问题
    切换lightdm图形页面之后,重启时无法进入界面:

    尝试了很多方法都没有作用,于是就重新安装了Ubuntu20.04。

七、重新安装Ubuntu20.04出现的GNU GRUB问题

  1. 在grub指令处,输入ls指令

    可以用来查看当前路径下的文件和文件夹。
    (hd0)、(hd0,msdos4)类似这些的输出是磁盘的分区,我们需要在这些分区内找到能够正确引导系统的文件配置。

  2. 寻找引导文件所在的位置
    使用类似的命令:

ls (hd0,msdos4)/

来一个个测试,看是否出现vmlinuz或者linuxinitrd.imgroot这样的字样:

3. 找到引导文件所在位置(hd0,msdos4),输入以下命令:

set root= (hd0,msdos4)
set prefix= (hd0,msdos4)/boot/grub
insmod normal
normal

参考资料

[1] Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.1及cuDNN8.0.4
[2] Ubuntu20.04系统,3090显卡,安装驱动、CUDA、cuDNN的步骤
[3] vscode 连接虚拟机(Ubuntu)
[4] Ubuntu安装和配置ssh教程
[5] linux向日葵远程安装及卸载和使用
[6] Ubuntu开机出现grub指令,无法正常开机

以上是关于Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题的主要内容,如果未能解决你的问题,请参考以下文章

关于RTX3090,ubuntu20.04环境下安装TensorFlow报错问题

关于RTX3090,ubuntu20.04环境下安装TensorFlow报错问题

关于RTX3090,ubuntu20.04环境下安装TensorFlow报错问题

Ubuntu20.04下安装显卡驱动

ubuntu 20.04 服务器系统经常死机

ubuntu18.04/20.04/22.04安装显卡驱动与显卡信息查询