最流行的深度学习神经网络算法——“卷积神经网络”现已在 CEVA-XM4 上实现
Posted CEVA
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了最流行的深度学习神经网络算法——“卷积神经网络”现已在 CEVA-XM4 上实现相关的知识,希望对你有一定的参考价值。
XM4 DSP 已经支持了 CEVA 深度神经网络 (CDNN) 软件框架。在介绍 CDNN 之前做一些简单说明会比较有帮助。CDNN 的“深度”来自于“深度学习”,这是一系列使用很多隐藏层的神经网络算法,因此称之为深度网络。最流行的深度学习神经网络算法是“卷积神经网络”。它之所以流行是因为 CNN 专注于特征表示,在目标识别、驾驶辅助 (ADAS) 或增强现实等应用中广泛使用, CNN在新兴应用中变得流行起来,从而推动了各个细分领域(从汽车到消费品)的发展。
CNN 有两个主要优点,首先,与其他识别算法相比,CNN 可以提供最出色的识别质量。其次,是算法的人工智能性,设计人员可以通过重新训练,一次实现,多次使用,而不必更改代码。这种优点可以大大加快嵌入式系统上对于机器学习的部署,开发人员希望此类系统可以尽可能长时间地自动运行,而不需要人工干预。
CNN 的第一个“N”表示“神经”,表明研究人员正努力在计算机中模仿人类的大脑。这种工作主要受计算能力、功率约束和算法质量限制,但技术的进步已经允许在嵌入式系统中引入神经网络。利用 CEVA-XM4 图像与计算机视觉 DSP 的计算能力,合作伙伴已经创建了最低功耗和内存带宽的深度学习解决方案,以提供实时、高效的目标识别与视觉分析功能。
预训练网络的概念非常棒:设计人员从离线训练(预训练)接收网络模型和权重作为设计的输入内容,而这些输入通过 CEVA 网络生成器可自动转换成一个实时网络模型。设计人员可以在 CEVA XM4 DSP 上的开发CNN 应用时使用这个实时网络模型。
下面描述基本开发流程
(Caffe 是一种流行的开源软件框架,用于构建、训练和激活神经网络)
用上面的流程图中,您会发现 CEVA 的主要贡献是网络生成器,而这有助于合并两种截然不同的技术。将浮点算法的网络转换成采用定点算法、能感知功耗并且硬件兼容的定制化网络,以达到嵌入式 DSP实现,同时保证较高的识别准确度。CEVA测试数据表明,与原始网络相比,准确度下降了不到 1%,这意味着图中的拉布拉多犬只有不到 1% 的比例会与猎兔犬混淆。
以合作伙伴的行人检测算法为例,利用 CDNN库 并针对 CEVA-XM4 DSP 进行了优化,在处理 1080p@30fps 视频输入时功耗还不到 30 mW,与一般的神经网络实现相比,平均内存带宽也仅为它们的 1/15。这使它成为了嵌入式系统里功耗最低的深度学习解决方案:与基于先进 GPU 的系统相比,功率只有其 1/30,处理速度却是其 3 倍。
CEVA 的市场营销副总裁 Eran Briman 认为“我们面向 CEVA-XM4 的新型深度神经网络框架是嵌入式行业中的首创,为帮助开发人员在功率受限的嵌入式系统中实现切实可行的深度学习算法往前迈出了一大步。”CEVA-XM4 图像与计算机视觉 DSP 携手 CDNN 框架为未来几年使用采用深度学习技术从而推动人工智能设备的发展铺平了道路。
以上是关于最流行的深度学习神经网络算法——“卷积神经网络”现已在 CEVA-XM4 上实现的主要内容,如果未能解决你的问题,请参考以下文章