高性能计算系列之三-常见名词二

Posted 2020-11-21

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了高性能计算系列之三-常见名词二相关的知识，希望对你有一定的参考价值。

GPGPU
　　GPGPU全称General Purpose GPU，即通用计算图形处理器。其中第一个“GP”通用目的(GeneralPurpose)而第二个“GP”则表示图形处理(GraphicProcess)，这两个“GP”搭配起来即“通用图形处理”。再加上“U”(Unit)就成为了完整的通用处理器。人们一直在寻找各种加速图像处理的方法，然而受到CPU本身在浮点计算能力上的限制，对于那些需要高密度计算的图像处理操作，过去传统的在CPU上实现的方法，并没有在处理性能与效率上有很大进步。随着可编程图形处理器单元(GPU)在性能上的飞速发展，利用GPU加速图像处理的技术逐渐成为研究热点。此产生了CPU + GPU的高性能计算方式。该方式下CPU专注于串行计算，而并行计算部分交由GPU 来完成。GPU 参与并行运算后，将计算机的运算能力提升了几倍到几十倍。目前广泛使用的GPGPU平台有CUDA,OPENCL等，CUDA是基于nVIDIA公司自家GPU架构的虚拟机PTX的GPGPU平台，OpenCL是一个跨平台的GPGPU解决方案。
CUDA
　　CUDA(Compute Unified Device Architecture)是NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员现在可以使用C语言来为CUDA架构编写程序，C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。
多线程
　　在一个程序中，这些独立运行的程序片段叫作“线程”(Thread)，利用它编程的概念就叫作“多线程处理(Multithreading)”。具有多线程能力的计算机因有硬件支持而能够在同一时间执行多于一个线程，进而提升整体处理性能。
　　
linpack
　　LINPACK是线性系统软件包(Linear system package) 的缩写，主要开始于 1974 年 4 月，美国 Argonne 国家实验室应用数学所主任 Jim Pool，在一系列非正式的讨论会中评估，建立一套专门解线性系统问题之数学软件的可能性。业界还有其他多种测试基准，有的是基于实际的应用种类如TPC-C，有的是测试系统的某一部分的性能，如测试硬盘吞吐能力的IOmeter，测试内存带宽的stream。至目前为止， LINPACK 还是广泛地应用于解各种数学和工程问题。也由于它高效率的运算，使得其它几种数学软件例如IMSL、MATLAB 纷纷加以引用来处理矩阵问题，所以足见其在科学计算上有举足轻重的地位。Linpack现在在国际上已经成为最流行的用于测试高性能计算机系统浮点性能的benchmark。通过利用高性能计算机，用高斯消元法求解N元一次稠密线性代数方程组的测试，评价高性能计算机的浮点性能。
算法
　　算法是一种描述程序行为的语言，是一种让程序最为简洁的思考方式。算法(Algorithm)是指解题方案的准确而完整的描述，是一系列解决问题的清晰指令，算法代表着用系统的方法描述解决问题的策略机制。也就是说，能够对一定规范的输入，在有限时间内获得所要求的输出。如果一个算法有缺陷，或不适合于某个问题，执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。
FLOPS
　　FLOPS是floating point operations per second每秒所执行的浮点运算次数的英文缩写。它是衡量一个电脑计算能力的标准，具体到TOP500和TOP100，指的是在跑Linpack这个基准测试软件时的浮点计算速度。一个MFLOPS (megaFLOPS) 等于每秒1百万 (=10^6) 次的浮点运算;一个GFLOPS (gigaFLOPS) 等于每秒10亿 (=10^9) 次的浮点运算;一个TFLOPS (teraFLOPS) 等于每秒1万亿 (=10^12) 次的浮点运算;一个PFLOPS (petaFLOPS) 等于每秒1千万亿 (=10^15) 次的浮点运算;一个EFLOPS (exaFLOPS) 等于每秒1百亿亿(=10^18)次的浮点运算。
PetaByte
　　PB(Petabyte，拍字节或千万亿字节或千T字节)是较高级的储存单位。我国天河二号超级计算机的存储容量就是以PB为单位的。1PB=1,024TB，比PB更大的单位还有EB、ZB、YB、BB，相邻两个单位之间，进率均为1024。
InfiniBand
　　InfiniBand架构是一种支持多并发链接的“转换线缆”技术，在这种技术中，每种链接都可以达到2.5 Gbps的运行速度。这种架构在一个链接的时候速度是500 MB/秒，四个链接的时候速度是2 GB/秒，12个链接的时候速度可以达到6 GB /秒。主要设计目的是针对服务器端的连接问题的。因此，InfiniBand技术将会被应用于服务器与服务器(比如复制，分布式工作等)，服务器和存储设备(比如SAN和直接存储附件)以及服务器和网络之间(比如LAN， WANs和the Internet)的通信。Infiniband和以太网是高性能计算机的主要网络；除了石油、渲染等领域仅需要以太网外，主要的科学计算由于进程间通讯频繁，都需要配置Infiniband高速网络。
Lustre
　　Lustre是HP、Intel、Cluster File System公司联合美国能源部开发的Linux集群并行文件系统，是第一个基于对象存储设备的、开源的并行文件系统。
曙光天潮高性能计算机
　　曙光是中国高性能计算领域的领导厂商，也是A股市场中第一家HPC厂商，在国内TOP100排行榜中，曙光已经连续6年占据份额第一位，也是IDC统计中唯一入选全球HPC前10的中国厂商，曙光4000A、曙光5000、曙光星云、曙光6000、曙光7000等都代表了不同时期中国商品化高性能计算机的最高水平。目前曙光天潮高性能计算机系列共有三大类产品，一是PC系列个人高性能计算机，其代表产品是PC300，二是HC系列异构高性能计算机，代表产品是HC2000，三是TC系列通用高性能计算机，其代表产品是TC6000和TC7000。
浪潮天梭高性能计算机
　　浪潮是我国高性能计算机领域的重要创新力量，其研发的HPC产品主打应用牌，包括浪潮天梭TS30000商用系统、浪潮高性能TS10000科研系统、浪潮天眼高性能应用特征监控分析系统等。
联想高性能计算
　　联想是中国高性能计算市场的开拓者之一，曾研制出深腾1800、深腾6800等一系列超级计算机，之后有所沉寂。在2014年10月1日宣布完成对IBM x86服务器整体业务的收购之后，联想也同时获得了IBM基于x86平台的HPC全线产品和技术。根据2014年11月份发布的TOP100榜单，联想(含IBM x86)凭借32套系统与曙光一起并列第一。
戴尔高性能计算
　　不同于其他厂商多以做大机器，追求技术领先或性能速度，参与国家大型科研项目为主要目标，戴尔的高性能计算机方案基于X86平台的开放标准构建，更强调成本与性能的平衡，是商品化HPC市场上的重要厂商。在应用方面，戴尔的HPC方案也有着独到的理念，如曾支持莲花车队(Team Lotus)，利用HPC和大数据分析技术，将F1赛车的速度加快了60%。
HP Apollo System
　　惠普公司推出的高性能计算系统，包括采用水冷技术Apollo 8000和采用空气冷却技术的Apollo 6000。
富士通K超级计算机
　　日本富士通和国家研究所共同研发的超级电脑“K”，运算速度曾是中国研制的“天河一号”3倍。K由68,544个CPU组成，运算速度等於100万台个人电脑总和。这是2004年NEC研发的“地球模拟器”(EarthSimulator)之后日本HPC领域最重要的超级计算机。
IBM蓝色基因
　　IBM致力于尖端超级计算的一个项目，2003年，蓝色基因的原型机经过三年研发问世，当年11月登上超级计算机“TOP500”第73名。其代表系统是蓝色基因/L(Blue Gene/L)
IBM沃森系统
　　超级电脑“沃森”由IBM公司和美国德克萨斯大学历时四年联合打造，电脑存储了海量的数据，而且拥有一套逻辑推理程序，可以推理出它认为最正确的答案。"沃森"(Watson)是为了纪念IBM创始人Thomas J. Watson而取的。IBM开发沃森旨在完成一项艰巨挑战：建造一个能与人类回答问题能力匹敌的计算系统。这要求其具有足够的速度、精确度和置信度，并且能使用人类的自然语言回答问题。这一系统没有连接至互联网，因此不会通过网络进行搜索，仅靠内存资料库作答。
天河2号
　　由国防科大研制的天河二号超级计算机系统，以峰值计算速度每秒5.49亿亿次、持续计算速度每秒3.39亿亿次双精度浮点运算的优异性能位居2014年6月TOP500榜首，成为全球最快超级计算机。
HPC软件
　　高性能计算软件跟一般企业里使用的ERP、数据库、操作系统等不同，在数量上非常繁多，涉及众多专业领域，比如：EDA设计仿真、CAE、数值计算、计算化学、计算物理、材料设计、量子力学、分子动力学、流体力学、工业设计、图像渲染、生物信息、生命科学、气象、天文、金融、石油勘探、工程计算、地震资料处理、集群管理、并行应用软件开发(MPI、OpenMP、CUDA)、Linpack测试研究、超算服务等等。
TOP100
　　中国高性能计算机性能TOP100排行榜简称，由中国软件行业协会数学分会联合国家863高性能计算机评测中心、中国计算机学会高性能计算专业委员会推出，每年11月份在HPC China(全国高性能计算学术年会)上正式对外界发布，已经成为中国高性能计算领域的风向标。
TOP500
　　全球高性能计算机TOP500性能排行榜，已经成为现在全球高性能计算产业发展的风向标，透过这个榜单，可以清楚地判断各国在超级计算领域技术与市场的发展与分布情况。1993年，美国田纳西大学诺克斯维尔分校的Jack Dongarra教授与德国曼海姆大学的Hans Meuer以及美国劳伦斯伯克利国家实验室的Erich Strohmaier与Horst Simon等人共同发起了TOP500榜单，以Linpack性能基准测试数据为主，每年的6月和11月分别发布两次排行，旨在提供一个可靠的基础去追踪与侦测高性能计算的趋势。其官方网站是：www.top500.org。类似的排行榜还有评测超级计算机能效的Green500，评测大数据、图形处理性能的Graph500，以及中国的高性能计算机TOP100性能排行榜。

　　2018年6月TOP500最新榜单

No.1 Summit（美国）
美国制造商：IBM
处理器：2,282,544 个；峰值速度：187,659 TFlop/s
简介：
Summit是IBM和美国能源部橡树岭国家实验室（ORNL）推出的新超级计算机，Summit 要比神威·太湖之光快 60%，比同在橡树岭实验室的 Titan——前美国超算记录保持者要快接近 8 倍。而在其之下，近 28,000 块英伟达 Volta GPU 提供了 95% 的算力。

No.2 神威太湖之光（Sunway TaihuLight），上届超算排行排名第一。
中国制造商：国家并行计算机工程技术研究中心
处理器：10,649,600 个；峰值速度： 125,436 TFlop/s
简介：
之前四届top500排名中，我国的神威 “太湖之光”超级计算机都是冠军，全部使用中国自主知识产权的芯片。

No.3 美国Sierra
美国制造商：IBM
处理器：1,572,480 个；峰值速度：119,193 TFlop/s
简介：
Sierra超级计算机美国×××橡树岭国家实验室已经给它定下来要做的事情，助力科学家在高能物理、材料发现、医疗保健等领域的研究探索。其中在×××研究方面将用于名为“CANcer分布式学习环境（CANDLE）”的项目。

No.4 TH—2 天河二号
中国制造商：国防科大
处理器：4,981,760个；峰值速度：33,862 TFlop/s
简介：
天河二号曾经6次蝉联冠军，采用麒麟操作系统，目前使用英特尔处理器，将来计划用国产处理器替换，不仅应用于助力探月工程、载人航天等政府科研项目，还在石油勘探、汽车飞机的设计制造、基因测序等民用方面大展身手。

No.5 日本ABCI
日本制造商：富士通
处理器：391,680 个；峰值速度：32,576 TFlop/s
简介：
AI Bridging Cloud Infrastructure简称ABCI，注于AI应用的大型云平台，由1,088个富士通服务器PRIMERGY CX2570 M4 x86服务器组成，每台服务器配备两个Intel Xeon Scalable家族处理器和四个NVIDIA Tesla V100加速器。

No.6 Piz Daint 代恩特峰
瑞士制造商：Cray
处理器：361760 个；峰值速度：25326 TFlop/s
简介：
由Cray公司为瑞士的国家超算中心打造，该超算同时也是Green500的第一名，可见其节能效果非常明显。

No.7 Titan 泰坦
美国制造商：Cray Inc
处理器：560640 个；峰值速度：27112 TFlop/s
简介：
泰坦从1993年就开始登了全球超级计算机top500，目前服务于美国能源部旗下橡树岭国家实验室(ORNL)，“泰坦”系统是之前“美洲虎”(Jaguar)的升级版，基于AMD处理器、NVIDIA加速卡的混合计算系统，曾在2009年11月问鼎世界冠军。

No.8 Sequoia 红杉
美国制造商：IBM
处理器：1,572,864 个；峰值速度：20132 TFlop/s
简介：
搭载IBM蓝色基因BlueGene/ Q系统的Sequoia（红杉）超级计算机安装在美国能源部劳伦斯·利弗莫尔国家实验室，Sequoia（红杉）在2012年6月登上了全球超级计算机top500的冠军宝座，之后则是一直排名在前三，充分证明了它的强大计算能力。

No.9 Trinity 三一
美国制造商：Cray
处理器：979968 个；峰值速度：43902 TFlop/s
简介：
Trinity超级计算机,由Cray公司建造,是由美国能源部洛斯阿拉莫斯国家实验室和桑迪亚国家实验室部联合部署的。

No.10 Cori 科里
美国制造商：Cray
处理器：622,336个；峰值速度：27880 TFlop/s
简介：
Cori是基于Cray公司的XC40超算，在美国国家能源研究科学计算中心(简称NERSC)使用，命名是纪念美国著名的生物化学家Gerty Cor（格蒂·科里），第一个获得诺贝尔奖的美国女科学家。

以上是关于高性能计算系列之三-常见名词二的主要内容，如果未能解决你的问题，请参考以下文章

Spark Streaming性能优化系列-如何获得和持续使用足够的集群计算资源？

高性能计算机体系结构