Ubuntu21.10下安装TensorFlow及配置GPU支持(cuda11.1+cudnn8.0.5)

Posted Z.Q.Feng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Ubuntu21.10下安装TensorFlow及配置GPU支持(cuda11.1+cudnn8.0.5)相关的知识,希望对你有一定的参考价值。

文章目录


一、前言

Ubuntu 下安装 TensorFlow 并不是简单的使用 pip 安装就可以的,如果不能使用 GPU 的话效率是会很低的,这里的方法都是自己在系统下搭建踩过一些坑摸索出来的,希望会有些帮助。

  • 系统:Ubuntu21.10
  • cuda版本:cuda11.1
  • cudnn版本:cudnn8.2.1

二、安装NVIDIAdriver

1. 添加PPA源

添加 PPA 源:

sudo add-apt-repository ppa:graphics-drivers/ppa

为系统安装依赖项以构建内核模块:

sudo apt-get install dkms build-essential

2. 查看显卡硬件型号

打开终端,输入如下命令

ubuntu-drivers devices

输出界面如下,可以看到这里我的硬件显卡型号为 GP108M [GeForce MX250],推荐安装的驱动版本号为:driver : nvidia-driver-470 - distro non-free recommended

3. 安装NVIDIA驱动

这里我们下载自己电脑推荐的驱动版本即可:

sudo ubuntu-drivers autoinstall

系统会自动安装推荐版本驱动,接着重启系统。


三、安装cuda

这里我用的 cuda 版本为 11.1,采用 .run 文件安装,最新的 11.6 版本试了有点问题,所以我换成了 11.1 版本。

1. 下载相关依赖

命令如下:

sudo apt-get install freeglut3 freeglut3-dev libxi-dev libxmu-dev

2. 下载安装文件

直接使用 wget 下载即可,这里我提供的是 11.1 版本的下载链接:

cd ~/Downloads
wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run

大概有 3 个多 G,注意网络连接。

3. 安装cuda-toolkit

这里我们只使用安装文件来安装 cuda-toolkit,driver 的安装我们在上述操作中已经完成,所以命令如下:

sudo sh ./cuda_11.1.0*.run --toolkit --silent --override

4. 配置环境变量

修改 ~/.bashrc 文件:

vim ~/.bashrc

添加如下内容:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

使修改立即生效:

source ~/.bashrc

5. 检验安装

命令如下:

nvcc --version


四、安装cudnn

1. 下载安装文件

这里我下载的是 8.2.1 版本,cudnn 的安装需要与你的 cuda 版本对应,官网下载链接如下:https://developer.nvidia.com/rdp/cudnn-archive,你可能需要注册才能下载(国内邮箱即可注册)。

2. 安装cudnn8.2.1

进入下载目录:

cd ~/Downloads

解压 tgz 包:

mkdir cudnn-11.1
tar -zxf cudnn-11.1*.tgz -C ./cudnn-11.1

进入解压后文件目录:

cd cudnn-11.1

安装执行文件并赋予权限:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

3. 配置环境变量

编辑 ~/.bashrc 文件:

vim ~/.bashrc

添加内容如下:

export LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64:$LD_LIBRARY_PATH

source 一下:

source ~/.bashrc

五、安装TensorFlow

1. 安装依赖包

安装 TensorFlow 之前需要我们安装一个依赖包,这里我的 cuda 版本为 11.1,下载依赖包为 libcudnn8_8.0.5.39-1+cuda11.1_amd64.deb,官网链接如下:https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/

这里我使用 wget 下载:

cd ~/Downloads
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/libcudnn8_8.0.5.39-1+cuda11.1_amd64.deb

安装命令如下:

sudo dpkg -i libcudnn8_8.0.5.39-1+cuda11.1_amd64.deb

2. 安装TensorFlow

直接用 pip 安装即可,这里要求 Python 版本为 3.6-3.9pip >= 19.0,先使用如下命令升级你的 pip 工具:

python3 -m pip install --upgrade pip

使用 pip 安装 TensorFlow,这里我选择的是阿里云:

pip install -i https://mirrors.aliyun.com/pypi/simple tensorflow

3. 测试

打开 Python,使用如下命令测试:

import tensorflow as tf
print(tf.__version__)

输出如下:

接着测试一下我们的 GPU 支持:

tf.config.list_physical_devices("GPU")

大功告成!


六、总结

以上是关于Ubuntu21.10下安装TensorFlow及配置GPU支持(cuda11.1+cudnn8.0.5)的主要内容,如果未能解决你的问题,请参考以下文章

Ubuntu21.10下安装使用Armadillo库

Ubuntu21.10下安装使用Armadillo库

ubuntu 21.10以后安装搜狗输入法的方法

Ubuntu下TensorFlow报错:Could not load dynamic library ‘libcudnn.so.8‘; dlerror: libcudnn.so.8: cannot..

ubuntu16.04下安装CUDA,cuDNN及tensorflow-gpu版本过程

ubuntu16.04下安装CUDA,cuDNN及tensorflow-gpu版本过程