3年完成2款云端AI芯片研发量产,百度造芯为什么这么快?

Posted QbitAl

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了3年完成2款云端AI芯片研发量产,百度造芯为什么这么快?相关的知识,希望对你有一定的参考价值。

明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI

3月完成独立融资、估值130亿元,6月分拆成立昆仑芯科技,8月发布昆仑2.0……

今年,百度在造芯上,都是大动作。

其中最瞩目的莫过于:将智能芯片架构部独立融资、分拆成立昆仑芯(北京)科技有限公司。

从这个动向不难看出,在“如何设计出更好的芯片”这个问题之上,商业化落地也成为了百度要考虑的事情之一。

那么百度的底气来自于哪?

3年量产2款云端AI芯片

这或许从百度研芯、造芯的历程上就能找到答案。

2018年,百度宣布自研中国首个云端AI芯片——百度昆仑1。

它采用14nm工艺,16GB HBM内存,提供512GB/s的内存带宽,每瓦算力达0.43TFlops。

2020年,百度CTO王海峰透露,百度昆仑1量产超过2万片,并已实现应用部署。

今年8月,升级版的昆仑2.0在百度世界大会上亮相。

7nm制程、百度自研2代XPU架构,每瓦算力1.07TFlops,支持NLP、视觉、语音等各种类型算法,能做推理也能做训练;同时支持C和C++编程。

较上一代而言,昆仑2.0在整体性能上提升了2~3倍,而且也已实现量产。

3年发布2款自研云端AI芯片,还都实现量产,百度在造芯上的速度可见一斑。

要知道,一款芯片想要实现量产,往往需要经历2~5年

在前端和后端设计就要耗时1~3年,设计完成后的流片环节需要3~6个月。当然还会有流片失败一切重来的风险;实际过程中,流片失败3~5次都很常见。

如果流片成功后,一般还需要经过3~12个月的测试调优,才能实现最终量产。

据百度昆仑芯商业分析师宋春晓透露,百度昆仑芯两代产品均在一年半左右完成设计,且都是一次流片成功。

为什么可以这么顺利呢?

这与百度早早入场造芯、专注FPGA不无关系。

2010年左右,百度就启动了FPGA AI加速器项目。

FPGA是特殊应用集成电路中的一种半定制电路。它的特点就是可以快速成品,内部逻辑可以被设计者反复修改,调试成本相对较低。

2015年,百度部署FPGA已经超过5000片,2017年则超过了12000片。

2018年后推出的昆仑系列,也是基于FPGA。

百度AI已经落地

事实上,在昆仑芯的支持下,百度的许多AI技术已经在我们身边悄然落地。

比如东京奥运会上,百度提供的国内首个“3D+AI”跳水辅助训练系统。

云端的3D视觉技术,可以实现运动员三维姿态重建,对跳水动作进行精准量化评估,进而实现智能打分。

教练员和运动员也可以借助AI系统,对训练视频进行高效的回顾、横向对比和纵向评估。

泉州水务大脑也是案例之一,百度通过AI技术手段帮助泉州水务集团整体人员效率提升了5%以上。

并且让制水供水单位能耗下降了8%、分散式污水处理设施运行可靠性提升5%,可以说是实现了良好的经济效益、管理效益和社会效益。

在国网新疆电力,基于百度智能云和国网电力联手建设的“AI中台”,电站巡检机器人能够代替人捕捉巡检过程中的每一处细微差错,既缓解了偏远地区巡检人力紧缺、工作环境恶劣的难题,又有力为西电东送提供保障。

今年百度世界大会上,李彦宏表示,新一代昆仑2.0可以部署的场景非常多,包括互联网核心算法、智慧城市、智慧工业等领域。

未来还将在HPC、生物计算、智能交通、无人驾驶等更广泛空间发挥作用。

在最近的百度AI开放日活动上,宋春晓还透露:未来,昆仑芯科技将会推出昆仑芯3、用于无人驾驶的昆仑芯和昆仑芯4。

以上是关于3年完成2款云端AI芯片研发量产,百度造芯为什么这么快?的主要内容,如果未能解决你的问题,请参考以下文章

DO周刊第11期-2018百度AI开发者大会

百度2018 AI开发者大会:“Everyone Can AI” |天风传媒文浩团队

AI简报20211015期第二代百度昆仑AI芯片实现量产寒武纪将推250TOPS算力的SoC智能芯片...

一年两款新品 寒武纪的研发效率为何如此高?

百度世界2021:百度大脑升级昆仑芯2量产智能云加速AI落地爆发

前紫光展锐CTO创业造芯:主打边缘AI视觉,融资10亿,9个月流片