nvidia gpu的环境配置

Posted chriscoder

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了nvidia gpu的环境配置相关的知识,希望对你有一定的参考价值。

gpu之环境配置

注:首先安装Nvidia显卡驱动,然后安装cuda和相应的cudnn, 最后配置环境。显卡驱动和cuda分别安装。

注: 有教程中说要把python库的链接从默认的2.7改到3.x, 因为系统很多配置是与python版本挂钩的,所以尽量不要改动python版本,否则很多软件会用不了。

N卡驱动安装

查看n卡驱动和cuda版本的对应关系:NVIDIA CUDA Toolkit Release Notes

注: 驱动安装后要重启电脑

sudo reboot
  • 使用Ubuntu系统的集成驱动管理和安装

现在新版的Ubuntu系统已经集成了驱动管理和安装工具,通过System Settings->SoftWare & Updates->Additional Drivers 切换安装,如果在备选的列表里没有找到NVIDIA的驱动,则通过如下解决:

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
  • 使用apt-get install安装
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-410 nvidia-settings nvidia-prime
  • 官方驱动编译安装(目前不太推荐)

  • 验证安装是否成功

查看驱动版本和显卡属性:

nvidia-smi

nvidia-settings
  • 删除nvidia驱动
sudo apt-get --purge remove nvidia-*
sudo rm -rf /usr/local/cuda-XX/

cuda安装

CUDA Toolkit

推荐安装cuda9.0或cuda10.0

选择Linux -> x86_64 -> Ubuntu -> 16.04 -> runfile(local) 或者deb(local)

sudo dpkg -i cuda-repo-ubuntu1604-xx_amd64.deb
sudo apt-key add /var/cuda-repo-<tab-complete>/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

注: 如果有patch(补丁)则下载相应的安装。

cudnn安装

NVIDIA cuDNN is a GPU-accelerated library of primitives for deep neural networks.

下载与cuda对应的deb包安装。

sudo dpkg -i libcudXX.deb

配置环境变量

打开个人配置文件:

sudo gedit ~/.zshrc

在文件尾部输入以下命令:

export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH

或者

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda

更新变量环境

source ~/.zshrc

测试cuda和cudnn

  • 使用cuda里面的samples来测试是否安装成功
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

cd usr/local/cuda-10.0/samples/1_Utilities/bandwidthTest
sudo make
./bandwidthYest
  • 如果返回结果是这样的:
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0, 
CUDA Runtime Version = 10.0, NumDevs = 1
Result = PASS

那你简直是很lucky!

  • 如果返回的结果是:
CUDADeviceQuery(RuntimeAPI)version(CUDARTstaticlinking)
cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for CUDA runtime version
Result = FAIL

有教程提到将Ubuntu中intel的集成显卡切换到nvidia显卡,但我试过没用啊!在终端输入:

nvidia-settings

在左侧栏找到PRIME Profiles, 进入切换即可。如果没有这一栏,则:

prime-select nvidia
  • 如果返回的结果是这样的:
cudaGetDeviceCount returned 30
-> unknown error
[deviceQuery] test results...
FAILED

目测多半是废了(捂脸.jpg)。

  • 删除cuda和cudnn
sudo apt-get --purge remove cuda-*
sudo rm -rf 

查看显卡占用情况

在终端中输入

watch -n 10 nvidia-smi

注:每隔10秒刷新一次终端

  • 结束进程
sudo kill -9  PID

tensorflow

未完待续

coffe

未完待续

参考

以上是关于nvidia gpu的环境配置的主要内容,如果未能解决你的问题,请参考以下文章

centos7配置(nvidia+cuda+cudnn+anaconda+tensorflow)gpu开发环境

Ubuntu16.04.5 配置英伟达NVIDIA 显卡 驱动实现GPU加速

Ubuntu22.04深度学习GPU环境配置:Nvidia CUDA 11.7cuDNN 8.5 详细解读(20220910)

Ubuntu22.04深度学习GPU环境配置:Nvidia CUDA 11.7cuDNN 8.5 详细解读(20220910)

Ubuntu22.04深度学习GPU环境配置:Nvidia CUDA 11.7cuDNN 8.5 详细解读(20220910)

深度学习 GPU环境 Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6 环境配置(