配置 Nvidia GPU 主机的运行环境

Posted shishaochen

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了配置 Nvidia GPU 主机的运行环境相关的知识,希望对你有一定的参考价值。

在 Linux 主机上配置了很多次 Cuda/CuDNN 的运行环境,在此记录下用到的脚本命令以复用。

特别提醒,先了解清楚 GPU 卡的型号,查清与主机 Linux 内核兼容的驱动程序、Cuda 和 CuDNN 的发行版。

请以 root 权限执行本文的所有 bash 命令。

1. NVIDIA 驱动安装

# WIKI: https://download.nvidia.com/XFree86/Linux-x86_64/375.20/README/installdriver.html 
wget http://us.download.nvidia.com/tesla/384.145/NVIDIA-Linux-x86_64-384.145.run && chmod u+x NVIDIA-Linux-x86_64-384.145.run && ./NVIDIA-Linux-x86_64-384.145.run --silent --dkms --accept-license

2. 打开持久模式

nvidia-smi -pm ENABLED # WIKI https://docs.nvidia.com/deploy/driver-persistence/index.html
# +-----------------------------------------------------------------------------+
# | NVIDIA-SMI 384.145                Driver Version: 384.145                   |
# |-------------------------------+----------------------+----------------------+
# | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
# | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
# |===============================+======================+======================|
# |   0  Tesla V100-PCIE...  Off  | 00000000:1A:00.0 Off |                    0 |
# | N/A   34C    P0    37W / 250W |      0MiB / 16152MiB |      0%      Default |
# +-------------------------------+----------------------+----------------------+
# |   1  Tesla V100-PCIE...  Off  | 00000000:1F:00.0 Off |                    0 |
# | N/A   36C    P0    36W / 250W |      0MiB / 16152MiB |      0%      Default |
# +-------------------------------+----------------------+----------------------+

 3. CUDA Toolkit 安装

wget https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run && chmod u+x cuda_9.0.176_384.81_linux-run && ./cuda_9.0.176_384.81_linux-run --toolkit --silent --verbos
cat << EOF >> /etc/ld.so.conf.d/cuda.conf
/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64
EOF
ldconfig
cat << EOF >> /etc/profile.d/cuda.sh
export PATH=/usr/local/cuda/bin:$PATH
EOF
source /etc/profile

4. CuDNN 安装

# CuDNN 下载需要 Nvidia 账号。直接访问以下 URL,会被重定向到登录页面。
# https://developer.nvidia.com/compute/machine-learning/cudnn/secure/v7.0.5/prod/9.0_20171129/Ubuntu16_04-x64/libcudnn7_7.0.5.15-1+cuda9.0_amd64
dpkg -i libcudnn7_7.0.5.15-1+cuda9.0_amd64.deb # 安装到 /usr/lib/x86_64-linux-gnu

 

以上是关于配置 Nvidia GPU 主机的运行环境的主要内容,如果未能解决你的问题,请参考以下文章

(转)深度学习主机环境配置: Ubuntu16.04+Nvidia GTX 1080+CUDA8.0

nvidia gpu的环境配置

VMware ESXi安装NVIDIA GPU显卡硬件驱动和配置vGPU

在没有物理 NVidia GPU 卡的虚拟机上运行 CUDA

NVIDIA公司推出的GPU运行环境下的机器人仿真环境(NVIDIA Isaac Gym)的安装——强化学习的仿真训练环境

centos7配置(nvidia+cuda+cudnn+anaconda+tensorflow)gpu开发环境