购买阿里云GPU虚拟化型实例规格族vgn6i抢占式实例并搭建CUDA 11.5和cuDNN 8.3.0

Posted 魏晓蕾

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了购买阿里云GPU虚拟化型实例规格族vgn6i抢占式实例并搭建CUDA 11.5和cuDNN 8.3.0相关的知识,希望对你有一定的参考价值。

1、阿里云GPU虚拟化型实例规格族vgn6i

官网地址:https://help.aliyun.com/document_detail/25378.htm?spm=a2c4g.11186623.0.0.77c36358aXqDBE#concept-sx4-lxv-tdb

vgn6i的特点如下:

  1. 如果您需要vgn6i实例支持OpenGL图形显示等图形功能,请使用NVIDIA vGPU相关软件,软件License的获取方式和实例规格、实例镜像类型有关:
  • ecs.vgn6i-m4-vws.xlarge和ecs.vgn6i-m8-vws.2xlarge:已包含NVIDIA Quadro vWS的软件License,您可以使用任意镜像类型。
  • 其他vgn6i实例(Windows镜像):创建实例时在镜像市场中搜索关键词GRID,并选用预装GRID驱动的收费镜像。这些收费镜像带有已经激活License的GRID驱动,不用再手动安装GRID驱动。关于如何选择镜像市场镜像,请参见创建配备GRID驱动的GPU实例(Windows)。
  • 其他vgn6i实例(Linux镜像):请提交工单申请GRID License,并创建未配备驱动的GPU实例。
  1. 计算:
  • 采用NVIDIA T4 GPU计算加速器
  • 实例包含分片虚拟化后的虚拟GPU
  • 计算能力支持NVIDIA Tesla T4的1/4和1/2
  • GPU显存支持4 GB和8 GB
  • 处理器与内存配比约为1:5
  • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake)
  1. 存储:
  • I/O优化实例
  • 仅支持SSD云盘和高效云盘
  1. 网络:
  • 支持IPv6
  • 实例网络性能与计算规格对应(规格越高网络性能越强)
  1. 适用场景:
  • 云游戏的云端实时渲染
  • AR和VR的云端实时渲染
  • AI(DL和ML)推理,适合弹性部署含有AI推理计算应用的互联网业务
  • 深度学习的教学练习环境
  • 深度学习的模型实验环境

vgn6i包括的实例规格及指标数据如下表所示。

实例规格vCPU内存(GiB)GPUGPU显存网络带宽(Gbit/s)网络收发包PPS多队列弹性网卡单网卡私有IP
ecs.vgn6i-m4.xlarge423NVIDIA T4 * 1/416GB * 1/4350万2410
ecs.vgn6i-m8.2xlarge1046NVIDIA T4 * 1/216GB * 1/2480万4520
ecs.vgn6i-m4-vws.xlarge423NVIDIA T4 * 1/416GB * 1/4350万2410
ecs.vgn6i-m8-vws.2xlarge1046NVIDIA T4 * 1/216GB * 1/2480万4520

我购买的是 ecs.vgn6i-m8.2xlarge,10核CPU,46G内存,NVIDIA T4显卡,8G显存,即上述表格中的第二项。

ECS 实例规格可购买地域总览:
网址:https://ecs-buy.aliyun.com/instanceTypes/?spm=a2c4g.11186623.0.0.3efd6358iIydA2#/instanceTypeByRegion

我选择的是第二项“华北2(北京)可用区 H”。使用“抢占式实例按量付费”方式购买,以下是我的购买过程截图。









后来进入控制台将操作系统改为 Windows Server 2019 数据中心版 x64。

2、搭建 CUDA 11.5

CUDA 各版本下载地址:https://developer.nvidia.com/cuda-toolkit-archive
把CUDA安装包 cuda_11.5.0_496.13_win10.exe 从本地远程传输到阿里云服务器上,点击“下一步”,CUDA会检查服务器配置,有没有NVIDIA显卡等硬件设备和驱动,检查完毕进行安装,直至安装完成。以下是我的安装过程截图。














CUDA 环境配置:
CUDA 安装完成,Windows Server 2019 的系统环境变量中已有下述配置:


在 PATH 环境变量中增加如下 CUDA 的路径配置:

命令行中查看 CUDA 版本,表明 CUDA 安装成功。

3、搭建cuDNN 8.3.0

cuDNN官网下载地址:https://developer.nvidia.com/rdp/cudnn-download
将cudnn-11.5-windows-x64-v8.3.0.98.zip在本地下载好后,上传到阿里云服务器中,将压缩包解压,将压缩包中的文件分别复制到CUDA安装目录的对应文件夹下。

CUDA安装目录:

cuDNN文件夹:




复制完毕,查看 cuDNN版本(include/cudnn_version.h):

4、释放阿里云服务器

CUDA 11.5和cuDNN 8.3.0安装完毕,打开开始菜单,已安装程序如下图。

由于购买的阿里云是按量付费,使用完毕,释放阿里云服务器。

以上是关于购买阿里云GPU虚拟化型实例规格族vgn6i抢占式实例并搭建CUDA 11.5和cuDNN 8.3.0的主要内容,如果未能解决你的问题,请参考以下文章

阿里云ECS云服务器购买须知(买前必看)!

阿里云服务器共享性N4性能如何,是否值得选购?

阿里云服务器共享性N4性能如何,是否值得选购?

小白用户选择那种类型的阿里云服务器比较合适?

小白用户选择那种类型的阿里云服务器比较合适?

阿里云服务器实例规格怎么选,阿里云所有实例规格适用场景汇总