centos7配置(nvidia+cuda+cudnn+anaconda+tensorflow)gpu开发环境

Posted 永胜永胜

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了centos7配置(nvidia+cuda+cudnn+anaconda+tensorflow)gpu开发环境相关的知识,希望对你有一定的参考价值。

一、安装准备

1、查看nvidia显卡,我的是T4显卡

lspci | grep -i nvidia


2、查看linux系统版本

uname -m && cat /etc/redhat-release


3、安装依赖

yum install gcc kernel-devel kernel-headers

二、安装nvidia驱动

1、禁用nouveau

lsmod | grep nouveau

如果有输出,那么就是nouveau在启用,需要关闭,按照以下步骤。centos7中禁用方法:

#打开如下文件
sudo vim /usr/lib/modprobe.d/dist-blacklist.conf
#写入以下内容
blacklist nouveau
options nouveau modeset=0
#保存并退出
:wq
#重启
sudo reboot
#最后输入上面的命令验证
lsmod | grep nouveau

没有任何输出,说明nouveau禁用了

2、安装驱动
第一步:打开NVIDIA驱动下载链接http://www.nvidia.com/Download/Find.aspx
第二步:选择适合自己的驱动,包括产品系列、操作系统、语言等
我这里安装的是11.2的版本

rpm -i nvidia-driver-local-repo-rhel7-460.106.00-1.0-1.x86_64.rpm
yum clean all
yum install cuda-drivers
reboot

3、检验驱动是否安装成功

nvidia-smi

三、安装cuda

1、浏览器输入地址:https://developer.nvidia.com/cuda-toolkit-archive

点击Download Latest CUDA Toolkit,跳转到该页面,根据系统版本进行选择

wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run
chmod +x cuda_11.2.0_460.27.04_linux.run
./cuda_11.2.0_460.27.04_linux.run

要把Diver这一个按Enter取消

2、配置环境变量

vim ~/.bashrc 
写入:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.2/lib64
export PATH=$PATH:/usr/local/cuda-11.2/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.2

source vim ~/.bashrc 

3、验证cuda生效:

nvcc -V

四、安装cudnn

1、下载地址:https://developer.nvidia.com/rdp/cudnn-download
2、解压cudnn

tar -xvf cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz
cd cudnn-linux-x86_64-8.7.0.84_cuda11-archive
sudo cp include/cudnn*.h /usr/local/cuda-11.2/include/ 
sudo cp lib/libcudnn* /usr/local/cuda-11.2/lib64/ 
sudo chmod a+r /usr/local/cuda-11.2/include/cudnn.h 
sudo chmod a+r /usr/local/cuda-11.2/lib64/libcudnn*

2、检查cudnn的安装

cat /usr/local/cuda-11.2/include/cudnn_version.h | grep CUDNN_MAJOR -a 

五、安装anaconda

1、在https://repo.anaconda.com/archive/下载anaconda安装包。
选择python3.88版本

2、安装anaconda

sh Anaconda3-2021.05-Linux-x86_64.sh

3、配置环境变量

vim ~/.bashrc 
# 配置anaconda
export PATH=/root/anaconda3/bin:$PATH

source ~/.bashrc 

4、检验conda

conda -V

六、配置pip源

1、在根目录下创建.pip文件夹

mkdir ~/.pip

2、使用vim打开pip.conf配置文件

vim ~/.pip/pip.conf

3、pip源配置文件

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple

七、安装tensorflow

1、安装tensorflow

pip install tensorflow==2.5.0

2、输入python进入开发
方法一:

import tensorflow as tf
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))


方法二:

import tensorflow as tf
a = tf.test.is_built_with_cuda()  # 判断CUDA是否可以用
b = tf.test.is_gpu_available(
    cuda_only=False,
    min_cuda_compute_capability=None
)                                  # 判断GPU是否可以用
print(a)
print(b)

以上是关于centos7配置(nvidia+cuda+cudnn+anaconda+tensorflow)gpu开发环境的主要内容,如果未能解决你的问题,请参考以下文章

Cuda Cudnn安装

ubuntu---NVIDIA驱动的多种安装方式

Centos7下安装CUDA

Cuda文档中的身份不明功能

20190407-cuda9-mixed-precision

NVIDIA三件套环境配置