nvidia gpu的环境配置
Posted chriscoder
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了nvidia gpu的环境配置相关的知识,希望对你有一定的参考价值。
gpu之环境配置
注:首先安装Nvidia显卡驱动,然后安装cuda和相应的cudnn, 最后配置环境。显卡驱动和cuda分别安装。
注: 有教程中说要把python
库的链接从默认的2.7
改到3.x
, 因为系统很多配置是与python版本挂钩的,所以尽量不要改动python版本,否则很多软件会用不了。
N卡驱动安装
查看n卡驱动和cuda版本的对应关系:NVIDIA CUDA Toolkit Release Notes
注: 驱动安装后要重启电脑
sudo reboot
- 使用Ubuntu系统的集成驱动管理和安装
现在新版的Ubuntu系统已经集成了驱动管理和安装工具,通过System Settings->SoftWare & Updates->Additional Drivers 切换安装,如果在备选的列表里没有找到NVIDIA的驱动,则通过如下解决:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
- 使用apt-get install安装
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-410 nvidia-settings nvidia-prime
官方驱动编译安装(目前不太推荐)
验证安装是否成功
查看驱动版本和显卡属性:
nvidia-smi
和
nvidia-settings
- 删除nvidia驱动
sudo apt-get --purge remove nvidia-*
sudo rm -rf /usr/local/cuda-XX/
cuda安装
CUDA Toolkit
推荐安装cuda9.0或cuda10.0
选择Linux -> x86_64 -> Ubuntu -> 16.04 -> runfile(local) 或者deb(local)
sudo dpkg -i cuda-repo-ubuntu1604-xx_amd64.deb
sudo apt-key add /var/cuda-repo-<tab-complete>/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
注: 如果有patch(补丁)则下载相应的安装。
cudnn安装
NVIDIA cuDNN is a GPU-accelerated library of primitives for deep neural networks.
下载与cuda对应的deb包安装。
sudo dpkg -i libcudXX.deb
配置环境变量
打开个人配置文件:
sudo gedit ~/.zshrc
在文件尾部输入以下命令:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
或者
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
更新变量环境
source ~/.zshrc
测试cuda和cudnn
- 使用cuda里面的samples来测试是否安装成功
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
和
cd usr/local/cuda-10.0/samples/1_Utilities/bandwidthTest
sudo make
./bandwidthYest
- 如果返回结果是这样的:
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0,
CUDA Runtime Version = 10.0, NumDevs = 1
Result = PASS
那你简直是很lucky!
- 如果返回的结果是:
CUDADeviceQuery(RuntimeAPI)version(CUDARTstaticlinking)
cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for CUDA runtime version
Result = FAIL
有教程提到将Ubuntu中intel的集成显卡切换到nvidia显卡,但我试过没用啊!在终端输入:
nvidia-settings
在左侧栏找到PRIME Profiles
, 进入切换即可。如果没有这一栏,则:
prime-select nvidia
- 如果返回的结果是这样的:
cudaGetDeviceCount returned 30
-> unknown error
[deviceQuery] test results...
FAILED
目测多半是废了(捂脸.jpg)。
- 删除cuda和cudnn
sudo apt-get --purge remove cuda-*
sudo rm -rf
查看显卡占用情况
在终端中输入
watch -n 10 nvidia-smi
注:每隔10秒刷新一次终端
- 结束进程
sudo kill -9 PID
tensorflow
未完待续
coffe
未完待续
参考
以上是关于nvidia gpu的环境配置的主要内容,如果未能解决你的问题,请参考以下文章
centos7配置(nvidia+cuda+cudnn+anaconda+tensorflow)gpu开发环境
Ubuntu16.04.5 配置英伟达NVIDIA 显卡 驱动实现GPU加速
Ubuntu22.04深度学习GPU环境配置:Nvidia CUDA 11.7cuDNN 8.5 详细解读(20220910)
Ubuntu22.04深度学习GPU环境配置:Nvidia CUDA 11.7cuDNN 8.5 详细解读(20220910)
Ubuntu22.04深度学习GPU环境配置:Nvidia CUDA 11.7cuDNN 8.5 详细解读(20220910)
深度学习 GPU环境 Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6 环境配置(