Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题
Posted Karen-CXZ
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题相关的知识,希望对你有一定的参考价值。
Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题
安装的步骤以及出现的问题
软硬件信息:
操作系统:Ubuntu20.04
显卡:GeForce RTX 3090
(小菜鸟装两台电脑踩过的所有坑)
一、安装Nvidia驱动
- 根据显卡型号3090,到官网下载驱动:
自己下载的版本是:
NVIDIA-Linux-x86_64-470.94.run - 禁用nouveau
打开终端,输入:
sudo gedit /etc/modprobe.d/blacklist.conf
在blacklist.conf文件末尾加上
blacklist nouveau
并保存。
然后执行:
sudo update-initramfs -u //应用更改
重启电脑:
reboot
验证是否禁用nouvea
lsmod | grep nouveau
若没有信息返回说明已经禁用
- 安装NVIDIA驱动:
打开terminal卸载旧版本NVIDIA驱动:
sudo apt-get remove –purge nvidia*
给驱动run文件赋予执行权限:
sudo chmod a+x NVIDIA-Linux-x86_64-470.94.run
安装:
sudo ./NVIDIA-Linux-x86_64-470.94.run -no-x-check -no-nouveau-check -no-opengl-files
安装过程出现的问题:
问题一:
出现unable to find the development tool cc的问题:
解决方法:
sudo apt-get update
sudo apt-get install gcc
安装完gcc之后继续执行安装的命令:
sudo ./NVIDIA-Linux-x86_64-470.94.run -no-x-check -no-nouveau-check -no-opengl-files
问题二:
出现unable to find the development tool make的问题:
解决方法:
sudo apt-get update
sudo apt-get install ubuntu-make
sudo apt-get install make
安装完make之后继续执行安装的命令:
sudo ./NVIDIA-Linux-x86_64-470.94.run -no-x-check -no-nouveau-check -no-opengl-files
安装过程中出现的选项:
选择Ignore CC version check继续
选择OK继续
Install NVIDIA’s 32-bit compatibility libraries?
选择No继续
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
选择 Yes
最后,输入nvidia-smi
查看NVIDIA版本检验是否安装成功
二、安装CUDA
-
到官网下载符合自己电脑的cuda版本
最后一项Installer Type建议选择runfile[local],因为更方便一些。
这里,我下载的是:cuda_11.4.0_470.42.01_linux.run -
安装
下载好之后,输入:
sudo sh cuda_11.4.0_470.42.01_linux.run
输入accept回车:
这个地方不要下载Driver,因为之前已经安装完了
取消选择的方法是:光标停留在Driver那一行上,然后回车,使[]里的X消失
选择install回车
看到上边的页面,则安装完毕
- 验证是否安装成功
cat /usr/local/cuda/version.txt
若没有这个文件,则在该文件夹下看看是否有version.json
有的话输入则输入:cat /usr/local/cuda/version.json
4. 设置环境变量
gedit ~/.bashrc
加入环境变量:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
保存并退出,终端运行:
source ~/.bashrc
- 查看是否安装成功:
终端运行:
nvcc -V
显示上述文字则代表安装成功。
(在安装另一台机子配置环境时出现了nvcc fatal: nvcc fatal:Failed to preprocess host compiler properties的问题:
解决方法如下:
在终端输入:
sudo apt-get install build-essential
再运行nvcc -V则成功
三、安装cuDNN
- 进入官网进行注册
- 下载CUDA对应的cuDNN版本
CUDA11.4下载的安装包:
- 解压
tar -xzvf cudnn-11.4-linux-x64-v8.2.4.15.tgz
- 将相关文件复制到CUDA路径
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
- 重建软链接
cd /usr/local
sudo rm -rf cuda //删除之前创建的软链接
sudo ln -s cuda-11.4 cuda //重建软链接
四、安装conda
- 到官网下载
找到最下边找到下图界面,根据自己所需要的版本进行下载:
我下载的是:Anaconda3-2021.11-Linux-x86_64.sh - 安装
打开终端,执行下列命令:
bash Anaconda3-2021.11-Linux-x86_64.sh
按回车继续安装
输入yes回车继续
按回车确认安装位置:/home/虚拟机名称/anaconda3
输入yes,继续
出现类似界面,则代表Anaconda3已经安装成功。
- 查看是否安装成功
最后可以输入conda list查看(重新打开一个终端):
五、安装 ssh
- 安装
sudo apt-get install sshd
- 查看是否安装
ssh -V
- 开启ssh服务
sudo service ssh start
- 查看ssh是否开启
sudo ps -e |grep ssh
(sshd如果只显示一个,则表明没有开启ssh服务)
解决方法:
sudo apt-get install openssh-server
ssh -V
sudo service ssh start
sudo ps -e |grep ssh
开启成功
5. 安装ssh服务器
sudo apt install openssh-server
- 安装ssh客户端
sudo apt install openssh-client
- 配置ssh客户端
终端运行:
sudo gedit /etc/ssh/ssh_config
去掉PasswordAuthentication yes前面的#号,保存并退出
- 配置ssh服务器
终端运行:
sudo gedit /etc/ssh/sshd_config
把PermitRootLogin prohibit-password改成PermitRootLogin yes,保存退出:
9. 重启ssh服务
sudo /etc/init.d/ssh restart
出现Restarting ssh (via systemctl):ssh.service.则安装成功:
六、解决向日葵无法连接的问题
- 安装并登陆好Ubuntu的向日葵客户端
在终端执行以下命令:
sudo apt-get update
sudo apt-get grade
sudo apt-get install lightdm
- 切换lightdm图形页面
sudo dpkg-reconfigure lightdm
- 重启
reboot
一台机子完全成功,可以顺利连接向日葵。
- 在另一台机子上出现的问题
切换lightdm图形页面之后,重启时无法进入界面:
尝试了很多方法都没有作用,于是就重新安装了Ubuntu20.04。
七、重新安装Ubuntu20.04出现的GNU GRUB问题
-
在grub指令处,输入ls指令
可以用来查看当前路径下的文件和文件夹。
(hd0)、(hd0,msdos4)类似这些的输出是磁盘的分区,我们需要在这些分区内找到能够正确引导系统的文件配置。 -
寻找引导文件所在的位置
使用类似的命令:
ls (hd0,msdos4)/
来一个个测试,看是否出现vmlinuz或者linux,initrd.img,root这样的字样:
3. 找到引导文件所在位置(hd0,msdos4),输入以下命令:
set root= (hd0,msdos4)
set prefix= (hd0,msdos4)/boot/grub
insmod normal
normal
参考资料
[1] Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.1及cuDNN8.0.4
[2] Ubuntu20.04系统,3090显卡,安装驱动、CUDA、cuDNN的步骤
[3] vscode 连接虚拟机(Ubuntu)
[4] Ubuntu安装和配置ssh教程
[5] linux向日葵远程安装及卸载和使用
[6] Ubuntu开机出现grub指令,无法正常开机
以上是关于Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题的主要内容,如果未能解决你的问题,请参考以下文章
关于RTX3090,ubuntu20.04环境下安装TensorFlow报错问题
关于RTX3090,ubuntu20.04环境下安装TensorFlow报错问题