详解Mellanox 200G HDR InfiniBand解决方案
Posted Hardy晗狄
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了详解Mellanox 200G HDR InfiniBand解决方案相关的知识,希望对你有一定的参考价值。
在数字信息的不断暴增的世界里,通过实时对分析数据挖掘其特征的能力已经成为一种竞争优势。一个先进的网络必须解决的问题就是快速和有效地传输不断增长的数据,同时必须实时地对数据进行分析。
网络协同技术已经彻底改变了这个行业,它清楚地表明,传统的以CPU为中心的数据中心架构已经过时了,在这种架构中,尽可能多的功能都需要被载到CPU上处理。过渡到以数据为中心的新体系结构要求网络高速且有效,这意味着它们必须把更多的功能从CPU卸载到网络中的其他地方,使CPU聚焦通用计算和控制调度。
更大网络吞吐量的迫切需求
随着数据分析的需求越来越多,对更高数据吞吐量的需求也越来越大。几年前,分析汽车构造或天气模拟的应用要求100Gb/s带宽,今天,高性能、机器学习、存储和超大规模技术要求更快的网络。
100Gb/s带宽对当今许多更先进的数据中心来说是不够的。无论是大脑绘图还是国家安全,都要求采用最高的超级计算机和数据中心应用在要求时间内产生处理分析结果。
因此,开发出能够支持当今最先进网络需求的200Gb/s技术,是一场正在进行网络技术竞赛。
回顾过去的十年,没有人比Mellanox更能超前推动网络这个行业向前发展了。从第一代到40Gb/s, 56Gb/s和100Gb/s带宽产品。Mellanox不仅提升了数据中心和云计算的性能,还提高了投资回报率,其速度远远超过了摩尔定律,甚至超过了它自己的路标规划预期。
为此,Mellanox现在宣布它是第一家在2018年使用Mellanox Quantum交换机、ConnectX-6适配器和LinkX电缆实现端到端200Gb/s数据速度的公司。
200G HDR InfiniBand交换机
Mellanox Quantum拥有40个200Gb/s HDR InfiniBand端口,提供16Tb/s惊人的双向吞吐量和每秒处理156亿条消息,而端口到端口的切换延迟只有90ns。
Quantum提供业界领先的160 SerDes集成能力,每个通道可灵活支持2.5Gb/s到50Gb/s,使Quantum成为世界上最灵活的交换机。
此外,Quantum还是最智能的交换机,它在遍历网络时处理数据,并消除了在端口之间多次发送数据的要求,从而提高了性能。通过通信加速器、可伸缩的分层聚合和(SHARP)2.0 MPI聚合和约简技术,Quantum满足从高性能计算到机器学习,甚至最苛刻应用程序的网络带宽和时延需求。
引入HDR100以获得终极可伸缩性
Mellanox Quantum还提供了HDR100选项,支持数据中心的终极可伸缩性。
每个端口使用两对双通道,Quantum可以支持最多80个100Gb/s的端口,从而成为了市场上最密集、最高效的ToR交换机。HDR100特性允许使用比竞争对手少1.6倍的交换机和2倍的电缆来连接一个400节点的计算系统。Quantum还可以在3-Level Fat Tree拓扑中连接128.000个节点,这比主流的专有产品网络交换机好4.6倍。
对客户来讲,最终问题则是采用40端口200G HDR去实现两倍吞吐量,还是使用一半交换机和线缆的80端口100G HDR100实现相同的吞吐量。Quantum对于今天的数据中心和HPC集群来说,都会带来最低的总体拥有成本。
200Gb/s InfiniBand和以太网适配器
ConnectX-6为InfiniBand和以太网提供无与伦比的性能,在600纳秒的延迟下,每秒可发送2亿条消息,提供200Gb/s的吞吐量。此外,与所有基于Mellanox标准的产品一样,ConnectX-6是向后兼容的,支持HDR、HDB 100、EDR、FDR、ODR、DDR和SDR InfiniBand以及200、100、50、40、25和10 GE。
ConnectX-6改进了Mellanox的多主机(Multi-Host)技术,最多允许8台主机通过将PCle接口分割成多个独立接口连接到单个适配器。这促成了多种新的机架设计方案诞生,通过减少资本支出(线缆、网卡和交换机端口费用)和运营成本(减少开关端口管理和总用电量)来降低数据中心的总体拥有成本。
存储客户将受益于ConnectX-6的嵌入式16通道PCle交换机,该交换机允许他们创建独立的设备,其中适配器直接连接到SSD。通过利用ConnectX-6PCle Gen3/Gen4的能力,客户可以使用NVMe设备构建大型、高效的高速存储设备。
网络内计算和安全卸载
ConnectX-6和Quantum支持新一代数据中心架构(以数据为中心的架构),在该架构中,网络成为分布式处理器。通过添加额外的加速器,ConnectX-6和Quantum可实现网络内计算和网络内存储功能,将进一步的计算任务转移到网络中,从而节省了CPU调度周期,提高了网络的效率。
ConnectX-6提供块级加密功能,为数据中心安全性提供了一项重要的创新。数据在传输中要经过加密,并通过ConnectX-6硬件在存储或检索时进行解密,从而降低延迟和减轻CPU负载。
此外,由于可以使用不同的加密密钥,ConnectX-6块级加密卸载支持在共享相同资源的用户之间进行保护。ConnectX-6遵守联邦信息处理标准(FIPS),减低了系统对自加密磁盘的要求。
LinkX InfiniBand和以太网有源光缆
Mellanox 200Gbs解决方案的最后一部件是LinkX电缆。Mellanox提供直连200G铜电缆,最高可达3米;200G有源光缆最高可达100米。200Gb/s线路的所有LinkX电缆都采用标准的QSFP56封装。此外,光缆提供了世界上第一个支持50Gb/s通道的硅光子学引擎。
Mellanox使能下一代数据中心
随着对密集数据分析需求的不断增加,对更高带宽的需求也相应增加。即使100Gb/s也不足以满足当今一些最苛刻的数据中心和集群的性能要求。此外,传统的以CPU为中心的互联方式已被证明对于这种复杂的应用程序来说效率太低。
Mellanox 200 Gb/s解决方案解决这些问题,通过提供了世界上第一个200Gb的交换机,适配器,电缆;通过启用网络内计算来取代CPU处理在整个网络的数据。通过200Gb/s解决方案,Mellanox在推动行业向Exascale计算机发展中仍然处于竞争的领先地位。
以上是关于详解Mellanox 200G HDR InfiniBand解决方案的主要内容,如果未能解决你的问题,请参考以下文章
如何在 Infiniband 中使用 GPUDirect RDMA