什么事GPU服务器,适用于那些应用场景?

Posted zdc博客-小白上云

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了什么事GPU服务器,适用于那些应用场景?相关的知识,希望对你有一定的参考价值。

阿里云GPU云服务器是基于GPU与CPU应用的计算服务器。GPU在执行复杂的数学和几何计算方面有着独特的优势,特别是在浮点运算、并行运算等方面,GPU可以提供上百倍于CPU的计算能力。GPU的功能特性如下:

  • 拥有大量擅长处理大规模并发计算的算术运算单元(ALU)。
  • 能够支持多线程并行的高吞吐量运算。
  • 逻辑控制单元相对简单。

GPU云服务器与自建GPU服务器的区别

对比项GPU云服务器GPU自建服务器
灵活性
  • 能够快速开通一台或多台GPU云服务器实例。
  • 实例规格支持灵活变更,并且支持在线升降配。
  • 带宽升降自由。
  • 服务器购买周期长。
  • 服务器规格固定,无法灵活变更。
  • 带宽一次性购买,无法自由升降。
易用性
  • Web在线管理,简单方便。
  • 内置主流的操作系统,Windows正版激活,且支持在线更换操作系统。
  • GPU驱动可以在购买时一并安装,方便快捷。
  • 没有在线管理工具,维护困难。
  • 需用户自备操作系统,自行安装及更换。
  • GPU驱动需要自行购买安装。
容灾备份
  • 三副本数据设计,单份损坏可在短时间内快速恢复。
  • 硬件故障事故中可快速自动恢复。
  • 用户自行搭建,使用普通存储设备,价格高昂。
  • 数据损坏需用户修复。
安全性
  • 能够有效阻止MAC欺骗和ARP攻击。
  • 并防护DDoS攻击,可进行流量清洗和黑洞。
  • 享有端口入侵扫描、挂马扫描、漏洞扫描等附加服务。
  • 很难阻止MAC欺骗和ARP攻击。
  • 清洗和黑洞设备需要另外购买,价格昂贵。
  • 普遍存在漏洞挂马和端口扫描等问题。
成本
  • 支持包年包月及按量付费两种购买方式,可灵活选择适合您业务场景的付费方式。
  • 按需购买,无需一次性大量投入。
  • 无法按需购买,必须为业务峰值满配。
  • 一次性投入巨大,闲置浪费严重。

产品优势

  • 高弹性

    提供系列化的规格族,分钟级创建GPU实例,支持水平扩容和垂直变配。

  • 高性能高安全性

    支持GPUDirect,GPU之间点对点通信。GPU可以直接通过NVLink总线互联通信,具备高带宽低时延的特点,无需CPU干预。多租户间弹性GPU安全隔离 ,并通过Hypervisor授权和管理。允许灵活配置多块GPU实现互相高速通信的同时,还具备隔离带来的安全性。

  • 易部署

    和阿里云生态深度融合,您可以轻松搭配其他阿里云产品构建应用,例如搭配OSS、NAS等产品满足存储要求,搭配EMR进行深度学习数据预处理等。支持云原生(阿里云Kubernetes),交付更加便捷。

  • 易监控

    提供全面的GPU监控数据,包括GPU、实例和分组维度,免去您的运维压力。

应用场景

GPU云服务器适用于视频转码、图片渲染、AI训练、AI推理、云端图形工作站等场景。

直播实时视频转码

阿里云异构GPU和FPGA服务器重点支持2019年天猫双11狂欢夜直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务天猫双11狂欢夜当天直播业务4K、2K、1080P等各个分辨率的转码。其中FPGA H.265高清编码、720P节省带宽21.6%,GPU云服务器支持高并发实时视频流5000路以上,并逐步上升到峰值6200路每分钟,且顺利度过流量洪峰。异构GPU云服务器还参与实时家居渲染图片生成等业务,首次提供了大量算力强劲的ebmgn6v裸金属实例,支持淘宝渲染方提升几十倍的渲染性能,第一次实现秒级实时渲染,完成总计超过5000张大型家居渲染图。异构FPGA图片转码业务则以3K+片的超大集群,为淘宝图片空间提供高达数百万QPS的处理能力,承担了双十一淘宝图片85%的流量,预计节省计算成本3亿。

AI训练

gn6v和gn6e具有优异的通用GPU计算加速能力,适合为深度学习提供加速引擎。

gn6v和gn6e实例分别配备具有16 GB显存和32 GB显存的NVIDIA V100 GPU计算卡,单节点可提供高达1000TFLOPS的混合精度计算能力。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。

AI推理

gn6i具有优异的AI推理能力。

gn6i实例基于配备NVIDIA Tesla T4 GPU计算卡,单精度浮点计算能力最高可达8.1 TFLOPS,int8定点运算处理能力最高可达130 TOPS,支持混合精度,满足了深度学习(尤其是推理)场景下的算力需求。同时单卡功耗仅75 W,具有极高的性能功耗比。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化您的部署操作。

云游戏、云网吧和云端图形工作站

vgn6i和gn6i均采用基于Turing架构的NVIDIA Tesla T4 GPU加速器,具有极佳的图形计算能力。vgn6i提供分片虚拟化后的虚拟GPU,支持T4 GPU计算能力的1/2、1/4、1/8,并提供极佳的3D图像渲染能力,适用于云游戏、云网吧等场景。vgn6i和gn6i实例可以结合云桌面产品提供云端图形工作站服务,应用于影视动画设计、工业设计、医疗成像、高性能计算的结果呈现等场景。

阿里云热门GPU服务器配置表

配置表参考:阿里云GPU云服务器

实例规格vCPU内存(GB)按量(小时)标准目录月价优惠月价年付月价3年付月价5年付月价
GPU计算型 ecs.gn7-c12g1.3xlarge129531.58315160.015160.015160.0015160.0015160.00
GPU计算型 ecs.gn7-c13g1.13xlarge52380126.33360640.060640.060640.0060640.0060640.00
GPU计算型 ecs.gn7-c13g1.26xlarge104760252.667121280.0121280.0121280.00121280.00121280.00
GPU计算型 ecs.gn7i-c8g1.2xlarge83012.716100.886100.886100.886100.886100.88
GPU计算型 ecs.gn7i-c16g1.4xlarge166013.4586459.756459.756459.756459.756459.75
GPU计算型 ecs.gn7i-c32g1.8xlarge3218814.9537177.57177.57177.507177.507177.50
GPU计算型 ecs.gn7i-c32g1.16xlarge6437629.90614355.014355.014355.0014355.0014355.00
GPU计算型 ecs.gn7i-c32g1.32xlarge12875259.81328710.028710.028710.0028710.0028710.00
GPU计算型 ecs.gn6e-c12g1.3xlarge129219.7399475.05779.754737.503979.503979.50
GPU计算型 ecs.gn6e-c12g1.12xlarge4836878.95837900.023119.018950.0015918.0015918.00
GPU计算型 ecs.gn6e-c12g1.24xlarge96736157.91675800.046238.037900.0031836.0031836.00
GPU计算型 ecs.gn6v-c8g1.2xlarge83226.467620.04648.23810.003200.403200.40
GPU计算型 ecs.gn6v-c8g1.8xlarge32128105.8430480.018592.815240.0012801.6012801.60
GPU计算型 ecs.gn6v-c8g1.16xlarge64256211.6860960.037185.630480.0025603.2025603.20
GPU计算型 ecs.gn6v-c10g1.20xlarge82336219.6463255.038585.5531627.5026567.1026567.10
GPU计算型 ecs.gn6i-c4g1.xlarge41511.633348.03348.02845.801841.401272.24
GPU计算型 ecs.gn6i-c8g1.2xlarge83114.04032.04032.03427.202217.601532.16
GPU计算型 ecs.gn6i-c16g1.4xlarge166216.414725.04725.04016.252598.751795.50
GPU计算型 ecs.gn6i-c24g1.6xlarge249317.194950.04950.04207.502722.501881.00
GPU计算型 ecs.gn6i-c24g1.12xlarge4818634.389900.09900.08415.005445.003762.00
GPU计算型 ecs.gn6i-c24g1.24xlarge9637268.7519800.019800.016830.0010890.007524.00
GPU可视化计算型 ecs.vgn6i-m4.xlarge4232.4451173.651173.651173.651173.651173.65
GPU可视化计算型 ecs.vgn6i-m8.2xlarge10465.0532425.562425.562425.552425.552425.55
GPU可视化计算型 ecs.vgn5i-m1.large261.95562.5562.5478.13309.38213.75
GPU可视化计算型 ecs.vgn5i-m2.xlarge4123.911125.01125.0956.25618.75427.50
GPU可视化计算型 ecs.vgn5i-m8.4xlarge164815.634500.04500.03825.002475.001710.00
GPU计算型 ecs.gn5-c4g1.xlarge43012.783681.03681.03128.851914.121288.35
GPU计算型 ecs.gn5-c8g1.2xlarge86015.394433.04433.03768.052305.161551.55
GPU计算型 ecs.gn5-c4g1.2xlarge86025.577363.07363.06258.553828.762577.05
GPU计算型 ecs.gn5-c8g1.4xlarge1612030.788866.08866.07536.104610.323103.10
GPU计算型 ecs.gn5-c28g1.7xlarge2811223.886877.06877.05845.453576.042406.95
GPU计算型 ecs.gn5-c8g1.8xlarge3224061.5717731.017731.015071.359220.126205.85
GPU计算型 ecs.gn5-c28g1.14xlarge5622447.7513753.013753.011690.057151.564813.55
GPU计算型 ecs.gn5-c8g1.14xlarge54480123.1335462.035462.030142.7018440.2412411.70
GPU计算型 ecs.gn5i-c2g1.large288.682500.02375.01875.001125.00750.00
GPU计算型 ecs.gn5i-c4g1.xlarge4169.692790.02650.52092.501255.50837.00
GPU计算型 ecs.gn5i-c8g1.2xlarge83211.673360.03192.02520.001512.001008.00
GPU计算型 ecs.gn5i-c16g1.4xlarge166415.634500.04275.03375.002025.001350.00
GPU计算型 ecs.gn5i-c28g1.14xlarge5622443.0612400.011780.09300.005580.003720.00
GPU计算型弹性裸金属服务器 ecs.ebmgn7i.32xlarge12876859.81328710.028710.028710.0028710.0028710.00
GPU计算型弹性裸金属服务器 ecs.ebmgn7.26xlarge104768252.667121280.0121280.0121280.00121280.00121280.00
GPU计算型弹性裸金属服务器 ecs.ebmgn6e.24xlarge96768157.9275800.046238.037900.0031836.0031836.00
GPU计算型弹性裸金属服务器 ecs.ebmgn6v.24xlarge96384237.12568292.041658.1234146.0028682.6428682.64
GPU计算型弹性裸金属服务器 ecs.ebmgn6i.24xlarge9638468.7519800.019800.016830.0010890.007524.00

以上是关于什么事GPU服务器,适用于那些应用场景?的主要内容,如果未能解决你的问题,请参考以下文章

ARM编译器那些事

什么是MVVM框架?它适用于那些场景?

关于MQ那些事

产品场景弹性裸金属服务器服务于市场的技术概要分析

轻量级服务器与云服务器的区别

一文搞懂PyTorch与CUDA那些事