国内首款百TOPS大算力芯片征程5，Q4将落地车企正式SOP

Posted 2023-05-09

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了国内首款百TOPS大算力芯片征程5，Q4将落地车企正式SOP相关的知识，希望对你有一定的参考价值。

参考技术A

地平线联合创始人&CTO黄畅博士现场分享

近日，地平线对外公布了其大算力芯片平台的最新进展和成果。地平线联合创始人、CTO黄畅博士对外表示，大算力AI自动驾驶芯片征程5将于2022年内完成全部车规可靠性与功能安全相关认证，正式达到量产成熟水平，并将于Q4在某头部造车新势力车型上率先SOP，征程5现已在实车环境下完成针对复杂城区自动驾驶场景的闭环验证。

地平线黄畅博士、吕鹏接受媒体采访

此前，地平线先后推出征程2和征程3车规级自动驾驶芯片，加速推进了我国车规级人工智能芯片量产的先河。继征程2和征程3之后，地平线推出的第三代车规级自动驾驶芯片征程5，兼具高性能和大算力特点，通过软硬协同，征程5的AI性能（FPS）刷新至1531FPS。

地平线将大算力自动驾驶芯片的比拼看作是一场世界杯的决赛。AI算力可以看作是预选赛，安全可靠性是小组赛，开发环境1/8决赛，算法验证是1/4决赛，生态支持可以看作是半决赛，量产则如同决赛。

地平线表示，征程5与英伟达一道率先进入TOPS芯片前装量产的阶段，提前锁定了决赛席位。

地平线是唯一完成量产级别测试流程的国内企业

地平线指出，这不是一场不战而胜的比赛，真正在量产决赛上见分晓前，每个环节都是作为一家AI芯片公司必经的考验。无论是对AI算力的比拼，安全可靠性要求，还是开发环境成熟水平，完成开发到产品闭环的验证，是否有软硬件生态支持到是否能拿到正式的量产定点项目，每一个环节其实都充满了挑战。

2022年4月份，征程5在实车环境下完成了城区复杂场景自动驾驶的闭环验证。同时，在持续打磨征程5的AI工具链，从2022年6月份开始，有多家软件生态伙伴推出基于征程5开发的高等级自动驾驶方案，并陆续推出原型Demo。

地平线智能驾驶产品规划与Marketing高级总监吕鹏现场分享

后续地平线会持续地推动征程5完成全部车规可靠性测试与全面功能安全认证工作，并在年内达到量产成熟水平。年末基于征程5芯片的首个量产项目也会正式SOP。

当前，地平线通过持续的积累有幸锁定了大算力芯片的世界杯决赛。

“软硬结合”是地平线对自己的技术路线一直秉承的重要方针。

征程5率先斩获多家车企量产定点

黄畅博士表示，“芯片的计算性能之所以能够持续更新，这是因为软件架构是可以不断更新的。虽然芯片的硬件架构已经没有办法改变，但芯片的软件架构一直在进行升级，由此才实现了征程5芯片的“持续成长”。

实际上，地平线的“软硬结合”就是在芯片设计、测试验证、量产上车的各个步骤都执行软件和硬件并行的操作模式。

高性能、大算力自动驾驶芯片征程5

在核心架构上，地平线征程5芯片的CPU部分采用8核心ARM Cortex A55，AI运算单元采用双核心地平线贝叶斯架构BPU（Brain Processor Unit）。同时，征程5芯片还有2个ISP核心、计算机视觉引擎、2个DSP核心、视频编码解码单元。

黄畅博士在媒体开放日介绍，去年7月份的发布会上128 TOPS，1283FPS，这是一个比较复杂的检测模型在MS COCO数据集上跑出来一个结果。最低延迟可以到60个毫秒，整个系统的平均功耗是30W左右。再告诉大家一个好消息，我们把计算性能这个数字提升了，上次发布会的时候是1283，通过我们的努力，现在把它提升到1531FPS。大家可能会觉得有点神奇，为什么一颗芯片不到一年前说是1283，今天反而变高了，硬件架构没有任何变化，算法也没有变，但是软件的架构变了。

正是基于这种理念，地平线最近几年迅速组建起了一支庞大的软件团队，甚至规模还超过了硬件团队。

其公司总计有1000多名员工，70%以上为研发人员。而研发人员中，算法、软件研发人员数量达到600人，并且软件研发人员的增长速度是最快的。

而受益于地平线的软硬结合的技术路径，地平线的征程5芯片也实现了AI计算性能的提升，实现更加高效的利用率。

随着汽车越来越智能，对于时延的要求也就越来越高，据悉基于征程5芯片的前视感知可以做到60毫秒，同时具备30瓦的低功耗。

征程5是全面满足高等级自动驾驶量产需求的芯片

征程5芯片自动驾驶计算延迟为60毫秒，这是指从摄像头感知、目标检测、判断应作出加速或减速动作时的延迟。而目前，市面上绝大多数产品都只能实现150毫秒左右的延迟。

黄畅博士介绍：“自动驾驶的延迟每下降60毫秒，可以减少1米多的刹车距离，也就意味着有可能就挽救一个人的生命。”

为了降低延迟，地平线针对自动驾驶场景，从摄像头在线输入、离线DDR，通过金字塔核心、拼接光流处理，能够在预处理阶段大幅降低延迟。在BPU核心中，地平线选择针对一次高效处理一张图片做架构优化，实现低延迟。

征程5是全面满足高等级自动驾驶量产需求的芯片

“现在大多服务器芯片会选择通过复用神经网络的参数，一次性批量处理十余张图片，这样一来，虽然处理量有所上升，但延迟会加大。”黄畅博士表示。“地平线选择对每一张图片进行极致的优化，而不是单纯追求一次性的处理量，这能够保证在实际场景应用中的速度最快，延迟最小。”

征程5是地平线的第三款车规级芯片，在此之前，征程2、征程3先后实现前装量产，帮助地平线拿下智能座舱、辅助驾驶的市场份额。而征程5芯片的出现，能让地平线在高阶自动驾驶领域和全场景整车智能领域再上新台阶。

总结： 随着征程5的正式推出，地平线成为能够覆盖从L2到L4智能驾驶芯片方案的提供商。截至目前，征程5已获得比亚迪、一汽红旗和自游家汽车等多家车企的量产车型定点项目。在第四季度正式SOP后，未来将有更多车企在高阶自动驾驶领域会与地平线产生更广泛合作。

本文首发钛媒体APP

AI简报20211015期第二代百度昆仑AI芯片实现量产寒武纪将推250TOPS算力的SoC智能芯片...

嵌入式AI

采用7nm制程！外媒：第二代百度昆仑AI芯片实现量产

原文:

http://www.cankaoxiaoxi.com/digital/2021/0917/2454120.shtml

参考消息网9月17日报道据新加坡《联合早报》网站近日报道，中国搜索引擎巨头百度表示，其自主研发的第二代昆仑AI芯片实现量产。

报道称，此前，百度创始人、董事长李彦宏在百度世界大会上发布第二代百度昆仑AI芯片。昆仑芯2采用7nm制程，搭载自研的第二代XPU架构，相比一代性能提升2至3倍，适用于云、端、边等多场景，未来将在自动驾驶、智能交通、智能助手等多个场景发挥功效。

寒武纪将推250TOPS算力车载智能芯片

原文:

https://ee.ofweek.com/2021-10/ART-8120-2805-30529379.html

“我们认为大算力和通用性将是智能驾驶芯片或者智能驾驶芯片的两个重要趋势。”日前，寒武纪行歌（南京）科技有限公司执行总裁王平在2021全球新能源与智能汽车供应链创新大会上宣布，其将在2022年推出第一款基于7nm先进制程、250TOPS算力的SoC智能芯片产品，2023年下半年会通过各种车规认证，实现整车SOP。

壁仞科技首款通用GPU台积电流片：7纳米，明年面向市场

原文:

https://www.sohu.com/a/494008748_260616

10月8日，创立于上海的通用智能芯片初创企业壁仞科技宣布其首款通用GPU——BR100正式交付台积电生产。该芯片采用7纳米制程工艺，性能参数对标的是国际顶级的GPU芯片产品，预计将于明年面向市场发布。

澎湃新闻从知情人士处获悉，BR100为目前全球面积最大、算力最大的人工智能芯片。

AI热点

利用AI谱写完成《第十交响曲》，人工智能真能让“贝多芬复活”？

原文:

https://world.huanqiu.com/article/45AkUO1chUr

【环球时报驻德国特约记者青木】“艺术创新还是技术噱头？”据德国《图片报》报道，贝多芬管弦乐团上周末在波恩首演人工智能（AI）谱写完成的贝多芬未竟之作《第十交响曲》。人工智能是否可以代替人类创作艺术，再一次成为争论焦点。

1827年贝多芬逝世时，留下的《第十交响曲》只有几张手稿留存，部分是简短未竟片段。为纪念贝多芬诞辰250周年，总部设立于贝多芬诞生地波恩的德国电信公司组织了一个专家团队，来自德国、奥地利和美国的音乐家、作曲家和人工智能专家把贝多芬的草稿、笔记及其生活时代的乐谱输入到人工智能系统中，通过分析和学习贝多芬的风格，应用复杂算法，加上人工雕琢，最后完成贝多芬巨作。

5300亿参数的「威震天-图灵」，微软、英伟达合力造出超大语言模型

原文:

https://www.jiqizhixin.com/articles/2021-10-12-5

在微软和英伟达的共同努力下， Turing NLG 17B 和 Megatron-LM 模型的继承者诞生了：5300 亿参数，天生强大，它的名字叫做「Megatron-Turing」。

刚刚，微软和英伟达联合推出了训练的「迄今为止最大、最强大的 AI 语言模型」：Megatron-Turing (MT-NLP)。

从公开披露的角度来看，MT-NLP 应该是现存最大的公共模型。

作为两家公司 Turing NLG 17B 和 Megatron-LM 模型的继承者，MT-NLP 包含 5300 亿个参数，并在一系列广泛的自然语言任务中表现出了「无与伦比」的准确性，包括阅读理解、常识推理和自然语言推理。

耗电量相当核反应堆运行15分钟，英伟达开源的StyleGAN3果然残暴

原文:

https://www.jiqizhixin.com/articles/2021-10-13-5

整个项目在 NVIDIA V100 内部集群上消耗了 92 个 GPU year 和 225 兆瓦时的电力，英伟达的 StyleGAN3 果然「壕气冲天」。今年 7 月，英伟达 StyleGAN 团队在 NeurIPS 2021 论文《 Alias-Free Generative Adversarial Networks 》中推出了 Alias-Free GAN，也即 StyleGAN3。

论文地址：https://arxiv.org/pdf/2106.12423.pdf

我们知道，典型的 GAN 具有分层卷积性质，但它们的合成过程过度依赖于绝对像素坐标。这就导致图像细节会粘连在坐标上，而不在描述对象的表面。因此，英伟达的研究者探究导致生成器网络中出现混叠的 careless 信号处理的根本原因。通过将网络中所有信号解读为连续性，他们进行了普遍适用的、小的架构变化，保证多余信息不会参与分层合成过程，并由此得到了 StyleGAN3。