NVIDIA显卡 - CUDA算力总结概览

Posted 明月醉窗台

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NVIDIA显卡 - CUDA算力总结概览相关的知识,希望对你有一定的参考价值。

Jetson Products

GPUCompute Capability
Jetson AGX Xavier7.2
Jetson Nano5.3
Jetson TX26.2
Jetson TX15.3
Tegra X15.3

GeForce and TITAN Products

GPUCompute Capability
GeForce RTX 30908.6
GeForce RTX 30808.6
GeForce RTX 30708.6
NVIDIA TITAN RTX7.5
Geforce RTX 2080 Ti7.5
Geforce RTX 20807.5
Geforce RTX 20707.5
Geforce RTX 20607.5
NVIDIA TITAN V7.0
NVIDIA TITAN Xp6.1
NVIDIA TITAN X6.1
GeForce GTX 1080 Ti6.1
GeForce GTX 10806.1
GeForce GTX 1070 Ti6.1
GeForce GTX 10706.1
GeForce GTX 10606.1
GeForce GTX 10506.1
GeForce GTX TITAN X5.2
GeForce GTX TITAN Z3.5
GeForce GTX TITAN Black3.5
GeForce GTX TITAN3.5
GeForce GTX 980 Ti5.2
GeForce GTX 9805.2
GeForce GTX 9705.2
GeForce GTX 9605.2
GeForce GTX 9505.2
GeForce GTX 780 Ti3.5
GeForce GTX 7803.5
GeForce GTX 7703.0
GeForce GTX 7603.0
GeForce GTX 750 Ti5.0
GeForce GTX 7505.0
GeForce GTX 6903.0
GeForce GTX 6803.0
GeForce GTX 6703.0
GeForce GTX 660 Ti3.0
GeForce GTX 6603.0
GeForce GTX 650 Ti BOOST3.0
GeForce GTX 650 Ti3.0
GeForce GTX 6503.0
GeForce GTX 560 Ti2.1
GeForce GTX 550 Ti2.1
GeForce GTX 4602.1
GeForce GTS 4502.1
GeForce GTS 450*2.1
GeForce GTX 5902.0
GeForce GTX 5802.0
GeForce GTX 5702.0
GeForce GTX 4802.0
GeForce GTX 4702.0
GeForce GTX 4652.0
GeForce GT 7403.0
GeForce GT 7303.5
GeForce GT 730 DDR3,128bit2.1
GeForce GT 7203.5
GeForce GT 705*3.5
GeForce GT 640 (GDDR5)3.5
GeForce GT 640 (GDDR3)2.1
GeForce GT 6302.1
GeForce GT 6202.1
GeForce GT 6102.1
GeForce GT 5202.1
GeForce GT 4402.1
GeForce GT 440*2.1
GeForce GT 4302.1
GeForce GT 430*2.1

Tesla Workstation Products

GPUCompute Capability
Tesla K803.7
Tesla K403.5
Tesla K203.5
Tesla C20752.0
Tesla C2050/C20702.0

Tesla NVIDIA Data Center Products

GPUCompute Capability
NVIDIA A1008.0
NVIDIA T47.5
NVIDIA V1007.0
Tesla P1006.0
Tesla P406.1
Tesla P46.1
Tesla M605.2
Tesla M405.2
Tesla K803.7
Tesla K403.5
Tesla K203.5
Tesla K103.0

Quadro Desktop Products

GPUCompute Capability
Quadro RTX 80007.5
Quadro RTX 60007.5
Quadro RTX 50007.5
Quadro RTX 40007.5
Quadro GV1007.0
Quadro GP1006.0
Quadro P60006.1
Quadro P50006.1
Quadro P40006.1
Quadro P22006.1
Quadro P20006.1
Quadro P10006.1
Quadro P6206.1
Quadro P6006.1
Quadro P4006.1
Quadro M6000 24GB5.2
Quadro M60005.2
Quadro K60003.5
Quadro M50005.2
Quadro K52003.5
Quadro K50003.0
Quadro M40005.2
Quadro K42003.0
Quadro K40003.0
Quadro M20005.2
Quadro K22003.0
Quadro K20003.0
Quadro K2000D3.0
Quadro K12005.0
Quadro K6205.0
Quadro K6003.0
Quadro K4203.0
Quadro 4103.0
Quadro Plex 70002.0

Quadro Mobile Products

GPUCompute Capability
RTX 50007.5
RTX 40007.5
RTX 30007.5
T20007.5
T10007.5
P6206.1
P5206.1
Quadro P52006.1
Quadro P42006.1
Quadro P32006.1
Quadro P50006.1
Quadro P40006.1
Quadro P30006.1
Quadro P20006.1
Quadro P10006.1
Quadro P6006.1
Quadro P5006.1
Quadro M5500M5.2
Quadro M22005.2
Quadro M12005.0
Quadro M6205.2
Quadro M5205.0
Quadro K6000M3.0
Quadro K5200M3.0
Quadro K5100M3.0
Quadro M5000M5.0
Quadro K500M3.0
Quadro K4200M3.0
Quadro K4100M3.0
Quadro M4000M5.0
Quadro K3100M3.0
Quadro M3000M5.0
Quadro K2200M3.0
Quadro K2100M3.0
Quadro M2000M5.0
Quadro K1100M3.0
Quadro M1000M5.0
Quadro K620M5.0
Quadro K610M3.5
Quadro M600M5.0
Quadro K510M3.5
Quadro M500M5.0

NVS Desktop Products

GPUCompute Capability
NVIDIA NVS 8105.0
NVIDIA NVS 5103.0
NVIDIA NVS 3152.1
NVIDIA NVS 3102.1

NVS Mobile Products

GPUCompute Capability
NVS 5400M2.1
NVS 5200M2.1
NVS 4200M2.1

GeForce Notebook Products

GPUCompute Capability
Geforce RTX 20807.5
Geforce RTX 20707.5
Geforce RTX 20607.5
GeForce GTX 10806.1
GeForce GTX 10706.1
GeForce GTX 10606.1
GeForce GTX 9805.2
GeForce GTX 980M5.2
GeForce GTX 970M5.2
GeForce GTX 965M5.2
GeForce GTX 960M5.0
GeForce GTX 950M5.0
GeForce 940M5.0
GeForce 930M5.0
GeForce 920M3.5
GeForce 910M5.2
GeForce GTX 880M3.0
GeForce GTX 870M3.0
GeForce GTX 860M3.0/5.0
GeForce GTX 850M5.0
GeForce 840M5.0
GeForce 830M5.0
GeForce 820M2.1
GeForce 800M2.1
GeForce GTX 780M3.0
GeForce GTX 770M3.0
GeForce GTX 765M3.0
GeForce GTX 760M3.0
GeForce GTX 680MX3.0
GeForce GTX 680M3.0
GeForce GTX 675MX3.0
GeForce GTX 675M2.1
GeForce GTX 670MX3.0
GeForce GTX 670M2.1
GeForce GTX 660M3.0
GeForce GT 755M3.0
GeForce GT 750M3.0
GeForce GT 650M3.0
GeForce GT 745M3.0
GeForce GT 645M3.0
GeForce GT 740M3.0
GeForce GT 730M3.0
GeForce GT 640M3.0
GeForce GT 640M LE3.0
GeForce GT 735M3.0
GeForce GT 635M2.1
GeForce GT 730M3.0
GeForce GT 630M2.1
GeForce GT 625M2.1
GeForce GT 720M2.1
GeForce GT 620M2.1
GeForce 710M2.1
GeForce 705M2.1
GeForce 610M2.1
GeForce GTX 580M2.1
GeForce GTX 570M2.1
GeForce GTX 560M2.1
GeForce GT 555M2.1
GeForce GT 550M2.1
GeForce GT 540M2.1
GeForce GT 525M2.1
GeForce GT 520MX2.1
GeForce GT 520M2.1
GeForce GTX 485M2.1
GeForce GTX 470M2.1
GeForce GTX 460M2.1
GeForce GT 445M2.1
GeForce GT 435M2.1
GeForce GT 420M2.1
GeForce GT 415M2.1
GeForce GTX 480M2.0
GeForce 710M2.1
GeForce 410M2.1

NVIDIA三件套环境配置

​对于做深度学习的环境而言,我们需要理顺以下之间的关系。

就比如PyTorch框架,版本越高,对于显卡算力的要求就会越高,显卡算力上去了,CUDA的版本也要跟上去,CUDA版本上去了,驱动版本也要跟上。。。

我个人而言一般会按照高版本的驱动+低版本的CUDA+与CUDA对应的cudnn+与CUDA对应的PyTorch这样的顺序去配置环境。

CUDA与驱动的对应关系

​但是其中会有玄学问题,自行探索!

多百度,都会解决的。

驱动

​遇到实在解决不了的问题,最简单的方法就是全部清除干净,重新上路。如果是新电脑第一次配置可以跳过清除操作。

# 卸载CUDA,对应好自己的版本号
sudo /usr/local/cuda-11.1/bin/cuda-uninstaller
sudo rm -rf /usr/local/cuda-11.1/

# 卸载驱动
sudo /usr/bin/nvidia-uninstall
sudo apt-get --purge remove nvidia*
sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*
sudo apt-get autoremove

# 确保不输出任何内容
sudo dpkg --list | grep mvidia*

# 确保禁用了开源驱动nouveau,理论上正常安装NVIDIA官方驱动会自动禁用
lsmod | grep nouveau
# 无输出即代表禁用成功

​其实CUDA会自带驱动,但是一般都是先装上驱动,再去安装CUDA,在安装CUDA的过程中取消安装CUDA自带的驱动。

当然也可以直接驱动和CUDA一起安装

# 对应好自己的卡下载对应驱动
下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn
# 下载好之后进入到文件所在目录,是一个run后缀的文件,加上执行权限
sudo chmod a+x NVIDIA-Linux-x86_64-470.82.00.run
sudo ./NVIDIA-Linux-x86_64-470.82.00.run
# 完成后重启一下
sudo reboot
# 测试一下,看看是否输出信息
nvidia-smi

CUDA

# 下载CUDA,下载run文件,不要deb文件,deb文件会在安装过程中替换掉已安装的驱动
下载地址:https://developer.nvidia.com/cuda-toolkit-archive

# 下载好之后进入到文件所在目录,是一个run后缀的文件,加上执行权限
sudo chmod a+x cuda_11.1.0_455.23.05_linux.run
sudo ./cuda_11.1.0_455.23.05_linux.run
# 如果是已经安装好驱动了,记得安装CUDA的时候取消安装驱动

# 安装完成后查看一下环境变量,理论上会自动在末尾添加
sudo vim ~/.bashrc
# 如果没有,记得自己追加,对应好版本
export PATH=/usr/local/cuda-11.0/bin$PATH:+:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64$LD_LIBRARY_PATH:+:$LD_LIBRARY_PATH
# 更新环境变量
source ~/.bashrc

# 测试版本
nvcc -V

#编译并测试设备 deviceQuery:
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

#编译并测试带宽 bandwidthTest:
cd ../bandwidthTest
sudo make
./bandwidthTest

NVIDIA三件套环境配置_驱动

cudnn

# 下载对应CUDA版本的cudnn,需要提前注册
下载地址:https://developer.nvidia.com/rdp/cudnn-archive
# 下载如下文件:

NVIDIA三件套环境配置_cudnn_02

# 解压后,进行文件替换
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
# 更改权限
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
# 安装deb包
sudo dpkg -i libcudnn8_8.0.5.39-1+cuda11.0_amd64.deb
sudo dpkg -i libcudnn8-dev_8.0.5.39-1+cuda11.0_amd64.deb
sudo dpkg -i libcudnn8-samples_8.0.5.39-1+cuda11.0_amd64.deb

# 完成后测试
cd /usr/src/cudnn_samples_v8/mnistCUDNN
sudo make
./mnistCUDNN
# 如图,成功

NVIDIA三件套环境配置_深度学习_03

问题汇总

运行sudo dpkg --list | grep mvidia*还有输出

英伟达的相关包还没删干净,对照输出的还剩的包,挨个删干净。

# 重复执行
sudo apt-get --purge remove xxx
# 最终确保运行以下命令确保无输出
sudo dpkg --list | grep mvidia*

运行lsmod | grep nouveau无输出,但还提示让禁用

理论上驱动会自行禁用nouveau开源驱动,但玄学问题,你懂的。

# 进行手动爆破
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
# 添加以下内容
blacklist nouveau options nouveau modeset=0
# 执行该命令实现更新
sudo update-initramfs -u
# 再次安装NVIDIA驱动即可,安装完成后立即重启

Ps:实现更新后再次安装驱动完成后可能会黑屏,稍等一下。再强制重启。

如果无法进入图形界面,Ctrl+Alt+F1切换到字符界面,Ctrl+Alt+F7切换到图形界面

提示缺少gcc g++ make等包

依次安装即可,常见于新系统。

建议安装完成后装一下build-essential依赖包​​sudo apt-get install build-essential​

以上是关于NVIDIA显卡 - CUDA算力总结概览的主要内容,如果未能解决你的问题,请参考以下文章

Nvidia的显示GeForce GT 1030的算力(compute capability)到底是多少?(附查询自己显卡算力的方法)

cuda 计算力查看

cuda支持的显卡

NVIDIA显卡支持CUDA,啥是CUDA

nvidia390对应的cuda

哪些NVIDIA显卡支持CUDA技术