如何破解算力与芯片这道难题?
Posted CSDN资讯
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何破解算力与芯片这道难题?相关的知识,希望对你有一定的参考价值。
在大数据时代,随着各行各业数字化转型进程的加快,算力成为重要的新型生产力。而算力是芯片单位时间里处理数据的能力,算力越高,单位时间里处理的数据量越大,芯片的性能越好。
在 2022 年 10 月 25 日长沙 ·中国 1024 大会中,我们特别设立了算力和芯片的挑战与突破论坛,重磅邀请了来自超算、芯片、RISC-V 架构等领域的代表,分享他们对算力与芯片发展的思考和实践,以及对当代开发者的建议,更有精彩的圆桌对话环节,探究开源新时代,创“芯”之路。
《算力和芯片的挑战与突破论坛》精彩回放:https://live.csdn.net/room/csdnlive2/Hed0PPek
算力如何进行提升?
在本论坛上伊始,来自阿里巴巴高级技术专家郁磊首先带来了《国产芯片的Python-AI算力优化》主题演讲。他表示,在如今 CNN 在图像和语音领域应用广泛,其中卷积计算占用了大部分的算力。想要实现卷积计算,可以使用矩阵乘法。
当谈及为什么在众多方案中要选择使用矩阵操作时,郁磊解释道,是因为在很多实践中已经证明矩阵操作是可以被优化的。GEMM 通过优化内容局部性和向量指令,可以比朴素实现快约 10 倍。不过,GPU、CPU 都支持了矩阵加速,但是众所周知,GPU 的算力是 CPU 很多倍,不在一个数量级,但是在这里依然选择使用 CPU 进行推理,主要是因为 CPU 存在优势场景,它比较轻量与简单,不需要额外的硬件,成本比较低,推理很多是在线服务,可以直接在 CPU 做计算,比较遗憾的就是没有可大规模使用 AMX 和 SME 实例。
在解决方案上,郁磊剖析道,可以用 BF16 数据类型来解决,主要是它可以方便地和 IEEE Float 32 做转换,拥有较少的存储空间可提高计算吞吐。为此,阿里平头哥发布了倚天 710 CPU,采用了先进的 ARM 架构,并支持 BF16 指令扩展。在具体的提高资源使用率,充分利用算力资源,行业中最常用的一种方法便是Serverless-Python。
AI 的到来,为高性能技术服务化带来了哪些改变?
紧接着,国家超级计算长沙中心总工程师、湖南大学教授唐卓在《高性能计算服务化——从算力网到AI融合计算》的演讲中说道,超高性能技术服务化是一个面向业务需求领域的全流程服务化,比较通用的行业是科学与工程计算,计算流程是从实际问题出发,然后将其提炼为数学模型,通过算法导入求解器中求解,然后按照模型或者数据分解为并行执行的任务,再通过任务调度并行计算得到计算结果。人工智能计算的整体流程也是从实际问题出发,然后通过建模,将数据输入,其中数据输入可以作为样本,进入模型训练,最终得到参数模型,再进行模型推断。
近年来,超高性能技术服务化和人工智能计算面临着多重的挑战,唐卓表示主要有三个方面:
- 大规模模型不断突破人工智能的算法能力,给传统高性能计算系统带来了巨大算力挑战;
- 传统科学计算的维度灾难挑战,其中 AI 有望解决 HPC 的不可解问题
- 传统超算在操作使用上难以原生适应智能应用场景、AI 计算特性为高性能计算服务化提出的更高要求,带来高基础设施挑战性能云服务
面对这些挑战,当前行业亟需解决一些高性能计算服务化的关键技术,主要涵盖以下几个方面,如任务调度与资源分配、高效的分布式机器学习环境、融合高性能计算与机器学习算子。
结合这些关键性技术,超算云服务平台应运而生,简单来看,该平台主要包含了三个子系统,即高性能计算资源池及管理子系统、跨域资源管理与多云级联、大数据并行处理与建模分析子系统。
算力背后,芯片的挑战
正如文章伊始所述,算力越高,芯片的性能越好,而芯片便是硬件领域最重要的根技术之一。
所谓根技术,进迭时空创始人兼首席执行官陈志坚表示,它是近几年频繁被提及的一个名词。顾名思义,是指所有技术的根,其能够衍生出并支撑着一个或多个技术簇,包含了芯片制造、架构、芯片与计算系统、软件、开源体系。
平常我们常见的电脑、PC、云服务都属于计算技术,计算系统的根技术包含了指令集、计算芯片、操作系统、数据库。
从计算系统角度来看,指令集是其计算系统的根。纵观指令集系统的演变,最为众人所熟知的主要有两种:x86 和 ARM 架构。其中,x86 是一种全封闭架构,主要被 Intel 和 AMD 享有,ARM 是一种半封闭架构,采用了与 x86 完全不同的商业模式,它是有 ARM 公司开发的,并开发了基于这个架构的处理器核,然后将处理器核卖到芯片公司,再者芯片公司集成这个处理器核之后去售卖。现如今,ARM 架构在全球已经占到 80%的份额,相比 x86 后来者居上。因此,从整个指令系统的演变中,也可以总结出两个规律,一个是指令集架构是一个高度马太效应的事务,当有越来越多的人使用时,意味着其生态壁垒越来越高,能够吸引越来越多开发者参与进来。第二个指令架构的竞争更多是商业模式的竞争,ARM 采用的更开放的架构。
x86 是伴随着 PC/互联网成长起来的,ARM 是随着移动互联网起来,面向当前的 AIoT 市场,陈志坚认为,其应用多样化适合 RISC-V 架构。作为开放架构,现在 RISC-V 起步晚,但是加速度快,我们要对 RISC-V 发展要持以乐观的态度,RISC-V 将成为下个时代的主流计算体系。
依靠开源,RISC-V 将改变世界
在 Rios 实验室联合主任,睿思芯科创始人兼董事长谭章熹看来,摩尔定律还在继续,但是我们不应该继续追逐“彩虹”。先进工艺是有很高的风险,而芯片和硬件/软件协同设计(DSA)才是个重要的方向,即在系统层面进行端到端优化。
通过 RISC-V、OpenEDA 等开源的方式,这将会改变世界。不过需要注意的是,要意识到法律和知识产权对开源技术的商业成功至关重要。
开源时代,创“芯”未来
在圆桌对话环节,当提及算力的巨大提升对芯片的影响时,英特尔研究院副总裁、英特尔中国研究院院长宋继强表示,算力是用来处理数据的,而数据从量的方面有了指数级的增长,很多数据来源对自然世界传感的数据,如自动驾驶、智能工厂、智能城市等,这些数据与过往有很大的不同,数据形式很多样。不过,传统的 CPU、GPU 来处理,已经无法满足需求,需要很多不同的计算加速硬件来处理它。这就使得对实时性要求特别高,未来算力的发展需要多种不同架构的芯片去支撑多种数据要求,如xPU等。
中国科学院计算技术研究所研究员唐志敏则表示,算力的增长,未必是一种好的现象。算力的增长也意味着能源的巨大消耗,这也是很多公司为什么要将数据中心建设到能源便捷的地方的主要原因。算力的增长带来的能源消耗问题,其实与全社会的碳中和等目标是背道而驰的。因此在算力迅速增长的今天,也需要从全系统的角度想出比较平衡的方案。
不过,在支撑算力的芯片领域,进迭时空创始人兼首席执行官陈志坚表示,最为主流的三大架构中,x86 宛如五六十岁的老人,ARM 宛如三四十岁的青年,而 RISC-V 宛如一个七八岁的小朋友,需要直面现实的是,RISC-V 在架构完善度上是比不上 x86 和 ARM 的。不过开源已经在软件领域证明了自己强大的生命力,从上世纪 90 年代起,UNIX、Linux 便是开源的见证与实践者。 RISC-V 的到来,其实是打开了硬件领域开源的大门,这对中国的意义非常重要。
那么如何吸引更多的人参与到芯片以及 RISC-V 的生态构建中,谭章熹认为,前提是需要有一个完整的教育体系。人才是整个行业发展的核心,计算机的知识教育需要培养其系统化。尽可能地通过开源,带来先进的教学理念与系统化的设计,这是对国内乃至全球化人才培养直观重要的。
在最后,鉴释首席执行官梁宇宁表示,秉持开放与共享,向着 Linux 的方向,越来越好。通过商业模式和开源的协同与合作,大家都可以在生态中实现商业化,未来也希望 RISC-V 打破地理位置的限制,越来越好。
《算力和芯片的挑战与突破论坛》精彩回放:https://live.csdn.net/room/csdnlive2/Hed0PPek
以上是关于如何破解算力与芯片这道难题?的主要内容,如果未能解决你的问题,请参考以下文章