汽车AI芯片“纵深战”
Posted 高工智能汽车
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了汽车AI芯片“纵深战”相关的知识,希望对你有一定的参考价值。
智能汽车的AI芯片,还有突围机会吗?一家名为Kneron的人工智能低功耗处理器公司给出了自己的答案。
这家公司刚刚从富士康和内存芯片制造商华邦电子获得新一轮战略投资,此前,包括李嘉诚旗下的维港投资、阿里巴巴创业基金、红杉资本、高通等知名行业巨头及机构参与了投资。目前,公司累计融资额约1亿美元。
Kneron创始人兼首席执行官Albert Liu之前曾在高通和三星负责芯片及相关软件研发,公司成立于2015年,目前格力空调、德国自动驾驶软件供应商Teraki都是合作客户。
作为战略协议的一部分,Kneron将与富士康新推出的电动汽车开放平台进行合作,而与华邦电子的合作将专注于基于MCU的人工智能和内存计算芯片。
Kneron瞄准的方向,是低功耗人工智能芯片,原因是大型GPU或CPU,功耗一直是一个大问题。而除了芯片设计,这家公司还提供AI软件算法支持,主打边缘侧AI处理。
一、
从去年开始全球芯片的短缺潮,使得传统芯片巨头忙于解决产能问题,而更多的投资者和初创公司看到了新的时间窗口期。尤其是汽车智能化对AI芯片的需求正在快速增加。
Kneron看中的,也是目前大多数芯片初创公司选择的开源RISC-V架构,这意味着不用受到ARM、x86等架构的授权限制,更可以实现一种差异化创新布局。
而目前,全球率先上车的RISC-V架构芯片,就是零跑汽车搭载的自研凌芯01芯片,单片算力达4.2Tops,域控制器由双片组成,总算力达8.4Tops,可实现L3级自动驾驶。
其中,CPU是阿里平头哥玄铁C860,采用的就是RISC-V架构,而非目前汽车芯片主流的ARM架构,功耗只有4W,制造采用了28nm制程工艺。
如今,Kneron最新发布的最新一代AI芯片KL530,就是采用RISC-V架构,同时配合谷歌在2017年提出的Vision Transformer算法,可以满足L1和L2级别的算力需求。
选择RISC-V,是因为这是一个开源的精简指令集架构,同时具备可扩展、模块化等特点,适合小型、快速和低功耗的应用设计,这对于智能电动汽车来说,至关重要。
而抛弃传统的卷积神经网络(CNN)并转向Vision Transformer,在Kneron公司看来是因为后者对于连续图像识别的准确度要比CNN高出30%。目前,包括特斯拉、毫末智行等公司都在采用Transformer视觉识别技术,提升抗干扰能力和识别精度。
在Kneron公司看来,要想超越传统的辅助驾驶能力,Transformer模型是必要的,因为它们可以进行整体推理,而不是像使用cnn那样只基于区分信息的关键特征进行推理。这意味着,系统可以实现高度精确的危险检测,显著提高安全性。
从KL530的IP核配置来看,除了NPU、ISP,还包括一个ARM Cortex-M4@400MHz CPU用于系统控制,在8位模式下提供0.5 TOPS峰值吞吐量,最大功耗低于500毫瓦。目前这款芯片已经拿到车规级认证。
对于KL530来说,另一个特点就是ISP处理器,可以处理1080P的高动态范围(HDR)影像,再通过机器学习和3D识别检测物体及更加准确的距离识别。
为此,Kneron公司在今年4月还专门收购了一家名为Vatic的图像信号处理(ISP)技术供应商,后者的产品之前已经在安防监控、汽车和消费市场有不少客户应用。这意味着,Kneron公司具备了自主研发NPU+ISP的视觉AI处理能力。
这一点,和国内的黑芝麻智能是同样的路线。
作为黑芝麻智能的两大核心自研IP之一,ISP的IP显得尤为重要。因为图像数据在给到神经网络之前如果没有调到最佳的状态,是很难靠后端的检测处理达到要求。而该公司的NeuralIQ ISP,对于每个MIPI的Block都会对应一个Pipeline,并且通过算法优化和调优。
以黑芝麻智能的A1000为例,内部的ISP可以处理12路摄像头,带宽30Gbps。对于夜间低光照的环境情况,内部ISP可以对图像做提亮,去噪,HDR,提升图像品质。
相比于其他芯片厂商采用第三方的ISP模块,自研能力的保障可以继续提升性能,而不是受制于外部供应商的通用性能限制。从这一点也可以看出未来汽车AI芯片的竞争,IP核的自研能力是一个典型的差异化竞争力。
二、
不过,对于类似Kneron这样不断涌现出来的AI芯片初创公司,市场验证还需要时间。
在业内人士看来,就像所有的创业公司一样,很多时候表面上的性能指标“听起来”不错,但真正的“魔鬼”在于细节,而且包括英伟达在内的传统芯片巨头也在不断提升性能,并且也在快速拥抱新的技术架构。
在这一点上,不少业内人士认为,现在谈论RISC-V对Arm架构带来的竞争压力有多大,还为时过早。比如,开源IP核目前最紧要的一件事就是如何满足汽车功能安全规范。尤其是从验证的角度来看,还有不少问题需要解决。
利好消息是,目前,一些RISC-V芯片嵌入式软件开发工具正在陆续拿到ISO26262功能安全认证。比如,IAR Systems的RISC-V开发工具链在今年初拿到了IEC 61508和ISO26262汽车功能安全认证,包括高度优化的IAR C/C++ Compiler™和功能丰富的C-SPY®调试器。
同时,在芯片成本上,RISC-V的确优势非常明显。以去年阿里平头哥发布的玄铁910为例,芯片性能提高一倍以上,同时芯片成本降低一半以上。
但,RISC-V似乎并非看上去那么“简单”。作为芯片架构设计行业的教父级人物,吉姆·凯勒认为,早期的X86和Arm,同样是因为简单、干净的特点而被大规模使用,但在不断的演进过程中,开始变得越来越复杂。“相对来说,RISC-V还处于复杂性生命周期的早期。”
不过,一些传统汽车芯片巨头也已经在RISC-V上进行战略布局。
今年4月,日本汽车芯片龙头瑞萨电子宣布与RISC-V芯片方案提供商SiFive, Inc建立战略合作伙伴关系,共同开发下一代半导体解决方案,来满足客户的特定需求。
SiFive智能平台基于SiFive RISC-V矢量处理器和AI ISA扩展,具有差异化的软件工具链,能够为AI和ML应用开发可扩展的解决方案。而瑞萨的目标是在现有Arm核的基础上,通过采用下一代高性能RISC-V核,扩展高端SoC和MCU开发能力。
而在SiFive和Kneron两家公司的背后,都有高通的身影。与此同时,三星、英特尔也是SiFive的投资者,这家公司也被视为Arm的最大潜在竞争对手之一,目前全球十大芯片制造商中有六家是SiFive的客户。
这意味着,一旦RISC-V架构在汽车前装市场成为主流选项之一,初创公司与传统巨头几乎都在同一起跑线上,市场竞争同样会异常激烈。
此外,由于RISC-V架构是开源的,任何人都可以在其上添加自定义指令——这是Arm所禁止的。这为客户和行业应用提供了一条生产特定设计的个性化道路,除了更低的功耗和更高的性能,意味着,目前相对同质化的SoC市场,有机会出现差异化竞争。
同时,目前软银集团仍在寻求出售Arm(此前英伟达宣布收购Arm,遭到了监管机构的阻力),许多业内人士认为,这是对RISC-V行业的巨大利好推动。
三、
此外,对于不管是纯视觉感知,还是多传感器融合感知,视觉(图像处理)能力除了受限于摄像头像素、芯片算力,还有很大部分因素涉及到ISP图像处理。
自动驾驶芯片的核心逻辑是先看清楚、才能看得懂,当前智能汽车所用的摄像头数量不断增加,像素也越来越高,数据量巨大,需要高能效比神经网络加速器把周围真正的目标识别出来。但如何清楚地感知周围的环境,还需要比较好的图像处理。
从特斯拉的工程师招聘清单,我们可以看到,图像质量调优工程师是经常可以见到的岗位,负责镜头、摄像头模块选型及开发、质量监控、摄像头校准、图像质量评估和优化调整。
其中,这些工程师要负责调整图像信号处理器(ISP)和摄像头参数,在各种光照条件下获得最佳质量的图像。此外,特斯拉的FSD芯片也集成了一个图像信号处理器(24位管道),用于处理8个摄像头采集的数据,每秒处理高达10亿像素以及相应的降噪功能。
而在手机行业,ISP处理器的重要性也不言而喻。比如,苹果手机的内置独立ISP和图像算法都是采取的自研策略。此后,包括华为、小米在内的公司也都跟进布局。
不过,应用于汽车行业的ISP,门槛更高。目前,大部分量产搭载的通用ISP并不是专门为自动驾驶应用开发,所以算法的兼容性会存在瓶颈。但由于800万像素摄像头正在成为高端智能汽车的首选,这对传统ISP的带宽处理能力提成了更高的要求。
以黑芝麻智能自主开发的ISP为例,带宽为1.5Gpps,可以在几毫秒内同时处理6个800万像素摄像头输入通道。此外,通过采用LED闪烁抑制(LFM)技术,可以有效消除交通灯和汽车LED照明的高频LED闪烁问题,提升不同照明条件下的交通信号和车灯识别算法准确度。
此外, ISP算法的重要性也是关键,尤其是解决夜间弱光环境下的驾驶辅助系统性能与白天的差异。同时,摄像头模块的适配和调优也至关重要。这一点,特斯拉就是典型成功案例。
更为关键的是,传统摄像头模组内置ISP的模式,正在逐步被高算力(中央域控)SoC内置高性能ISP所取代。这其中,还要考虑到高像素摄像头产生的高热量。
比如,安波福在去年提出了一套新的解决方案:基于此前的卫星电子架构原理,摄像头也可以仅保留光学部分和CMOS芯片,将图像处理芯片转移至域控制器,通过LVDS总线以及以太网来进行数据的传输。
同时,高性能ISP被集成到视觉处理器(SoC)中,意味着可以同时处理多个摄像头数据,实现系统级成本下降。以英伟达Orin为例,硬件部分拥有超高带宽图像接口,ISP每秒可处理64亿像素。
而TI的第7代ISP,支持更高的位深度,FPD-Link III解决方案可以满足“卫星”传感器到中央融合处理单元的低成本、可扩展要求,一个ISP为多个摄像头实现更好的光度校准,并确保颜色增益和噪声过滤器运行在同一时间,使多个摄像头的视图拼接更自然。
从中也可以看出,在现有的硬件架构下,视觉处理能力还有很大的提升空间。但前提是,对于从摄像头数据采集开始,到后端的图像优化、数据处理提出了更高的要求。
以上是关于汽车AI芯片“纵深战”的主要内容,如果未能解决你的问题,请参考以下文章
AI简报20220311期汽车AI芯片竞赛加速苹果最强芯M1 Ultra登场
台积电争夺汽车芯片AI芯片订单,春天来了,外媒:高兴得太早了