边缘AI研发落地生态挑战调研报告发布

Posted 2022-01-11 华为云开发者社区

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了边缘AI研发落地生态挑战调研报告发布相关的知识，希望对你有一定的参考价值。

摘要：随着边缘设备的广泛使用和性能提升，将机器学习相关的部分任务迁移到边缘，也即边缘AI技术，已成为必然趋势。但仅凭技术是不足够完成落地和产业转化的。近日我们启动了边缘AI研发落地生态挑战调研。我们发现，当前学界业界在落地过程已经遇到各式各样的困难，重点生态挑战包括数据集和配套算法难以获取、通用方案无法满足特定业务需求、缺乏商业成功案例等。

本文分享自华为云社区《华为云 - 边缘AI研发落地生态挑战调研报告》，作者：边缘云创新实验室。

随着边缘设备的广泛使用和性能提升，将机器学习相关的部分任务迁移到边缘，也即边缘AI技术，已成为必然趋势，甚至能够同时结合云侧算力和边侧数据来完成机器学习任务。机器学习服务将边缘产生的数据转换为知识的过程中，需要在边缘快速响应并处理本地产生的数据。在落地过程中，我们发现，在连接海量边缘节点的边缘云时代，随着AI服务与边缘用户的距离缩短，通用AI原本部分挑战在边缘场景下变得更加尖锐。

基于一些落地经验，华为云边缘云创新实验室（ECIL，Edge Cloud Innovation Lab，Huawei Cloud）系列文章中曾介绍过数据异构等四大技术挑战。针对这些挑战，各个技术方案落地与成果转化到产业的进程正在紧锣密鼓地进行。但仅凭技术是不足够完成落地和产业转化的。当前学界业界很多团队已经遇到各式各样的困难，比如数据集难以获取、通用方案无法满足特定业务、缺乏商业成功案例等。

因此除了技术挑战外，华为云边缘云创新实验室一直密切关注边缘AI的生态挑战*。为了让更多边缘AI领域的朋友多快好省地完成技术研发落地和商业闭环，华为云边缘云创新实验室启动了边缘AI研发落地生态挑战调研。本次调研通过问卷发放的方式，希望进一步了解边缘AI方案落地与产业落地过程中遇到的生态挑战。截至2021年11月29日，已回收有效答卷175份，问卷开放选项采集到49条补充意见和8条补充建议。对答卷中共计20项量表题项进行分析，信度Cronbach. **为0.975。

*比如研发资源难获取、工具链不完备等主要依赖社区分工与共享的非技术挑战，在本文中定义为生态挑战

**信度指同一问卷对同一组对象重复测量时所得结果的一致性程度，用于测量样本回答结果是否可靠。如果在0.8以上,则该测验或量表的信度非常好；如果低于0.6,量表就需要重新设计题项。

根据调研结果，对边缘AI各角色而言，当前阻碍研发落地，首当其冲生态挑战分别是

算法开发者：“真实业务数据集及其基线算法、预训练模型难以获取”
服务开发者：“通用方案整体性能不一定满足特定业务需求”
技术布道者：“缺乏商业成功案例”

具体调研报告结果请见下文。

1、调研对象

调研对象职业主要是工业界从业者（53.45%），其次是在校学生（31.03%）和学术界研究者（25.86%）。

调研对象的技术方向主要是边缘AI及其应用（55.75%）、AI及其应用（49.43%）、边缘计算及其应用（42.53%）。也有约四分之一的方向为云计算及其应用（25.86%），以及少量的其它方向（13.22%）。

2、边缘AI算法开发者

本问卷中，边缘AI算法开发者是指研发联邦学习、协同推理乃至深度学习调度等边缘AI典型算法的角色。有80.46%调研对象填写了边缘AI算法开发者相关问卷调研选项。对每个挑战的负面影响有四种选项，包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。

本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果，本章末尾将小结各不同维度的结论。

2.1平均分

若选择“不了解跳过”或“可维持现状”记为0分，“建议改进”记为5分，“亟需改进”记为10分，答卷中对边缘AI算法开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.43分，问卷中所罗列的各挑战都超过了5分，可以认为各挑战都有改进的需求。

其中，平均分值最高（6.87分）的挑战是：

“真实业务数据集及其基线算法、预训练模型难以获取”

在截尾均值* 6.09分以上的其它头部挑战还包括：

“算法研发迭代中，重复部署整套端边云系统过于沉重”
“缺乏AI工具，包括资源监控、节点仿真、标注工具等”
“算法找不到对应业务场景，或很难得知实际业务落地性能”

*截尾均值指是指在一个数列中，去掉两端的极端值后所计算的算术平均数。在本问卷中用于屏蔽最后一个开放选项的影响，下同。

从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象（三者在调研对象中的比例大致为2:1:1），细化算法开发者各项挑战平均分：

“边缘AI及其应用”方向下各职业平均分值最高的算法开发挑战分别是：

工业界：“缺乏AI工具，包括资源监控、节点仿真、标注工具等” （平均分7.5）
学术界：“缺乏真实业务及其研究需求的固定来源” （平均分7.14）
在校学生：“真实业务数据集及其基线算法、预训练模型难以获取”（平均分7.68）

在截距均值以上的其它头部挑战还包括：

工业界（截距均值6.19）：

“真实业务数据集及其基线算法、预训练模型难以获取”（平均分7.1）
“算法研发迭代中，重复部署整套端边云系统过于沉重”（平均分7）
“边缘AI系统部署等起步过程中缺乏指南文档”（平均分6.35）

学术界（截距均值6.30）：

“真实业务数据集及其基线算法、预训练模型难以获取”（平均分6.96）
“缺乏AI工具，包括资源监控、节点仿真、标注工具等”（平均分6.72）

在校学生（截距均值6.77）：

“缺乏真实业务及其研究需求的固定来源”（平均分7.41）
“算法找不到对应业务场景，或很难得知实际业务落地性能”（平均分7.59）

2.2亟需改进

对于边缘AI算法开发者，问卷中提及的挑战被选为“亟需改进”的比例通常三分之一左右，高于“还有其他重要挑战”的6.36%，可以认为各个挑战都有相当的迫切需求。

其中被选为“亟需改进”的挑战中比例最高（42.77%）的是：

“真实业务数据集及其基线算法、预训练模型难以获取”

在截尾均值（33.33%）以上的其它头部挑战还包括：

“算法研发迭代中，重复部署整套端边云系统过于沉重”
“缺乏AI工具，包括资源监控、节点仿真、标注工具等”
“算法找不到对应业务场景，或很难得知实际业务落地性能”
“边缘AI系统部署等起步过程中缺乏指南文档”

可以看到，除了一个挑战，“亟需改进”和“平均分”头部挑战基本保持一致，这个有区别的挑战是：

“边缘AI系统部署等起步过程中缺乏指南文档”

但可以观察到，除了“亟需改进”维度，该挑战其实在“平均分”维度也是非常接近头部（距离截尾均值0.02），这说明其重要性。

2.3可改进

问卷中的绝大部分挑战都以较大比例（63.1% - 69.94% ）被选为“建议改进”和“亟需改进”（下总称“可改进”），对比认为“有其他重要挑战”需改进的比例仅为13.87%，说明列举在问卷中相关挑战大部分都明显有改进的需求。

其中，被认为“可改进”的挑战中比例最高（69.94%）的是：

“真实业务数据集及其基线算法、预训练模型难以获取”

在截尾均值（67.06%）以上的其它头部挑战还包括：

“缺乏真实业务及其研究需求的固定来源”
“边缘AI系统部署等起步过程中缺乏指南文档”
“缺乏AI工具，包括资源监控、节点仿真、标注工具等”
“算法研发迭代中，重复部署整套端边云系统过于沉重”

与“亟需改进”相比，“可改进”维度头部部分选项排名有变化。

1、在“可改进”维度头部选项中，比“亟需改进”排名更高的挑战，可以认为是有一定的重要性，但相对不那么紧急。这些可能看上去更“长远”的“重要不紧急”挑战包括：

“缺乏真实业务及其研究需求的固定来源”
“边缘AI系统部署等起步过程中缺乏指南文档”

第二个挑战也与“亟需改进”部分结论一致。

2、在“亟需改进”维度头部选项中，比“可改进”排名更高的挑战，可以认为是一定的重要性，但相对比较紧急，这些看上去更“紧迫”的“重要且紧急”挑战包括：

“算法研发迭代中，重复部署整套端边云系统过于沉重”
“缺乏AI工具，包括资源监控、节点仿真、标注工具等”

2.4小结

对边缘AI算法开发者有以下结论：

1.平均分值最高（6.87分）的挑战是：“真实业务数据集及其基线算法、预训练模型难以获取”

2.其它头部重要挑战中

“重要不紧急”头部重要挑战包括：“缺乏真实业务及其研究需求的固定来源”“边缘AI系统部署等起步过程中缺乏指南文档”
“重要且紧急”头部重要挑战包括：“算法研发迭代中，重复部署整套端边云系统过于沉重”“缺乏AI工具，包括资源监控、节点仿真、标注工具等”

3.“边缘AI及其应用”方向下算法开发各职业平均分值最高的生态挑战分别是：

工业界：“缺乏AI工具，包括资源监控、节点仿真、标注工具等” （平均分7.5）
学术界：“缺乏真实业务及其研究需求的固定来源” （平均分7.14）
在校学生：“真实业务数据集及其基线算法、预训练模型难以获取”（平均分7.68）

问卷中也尝试调研边缘AI算法开发其余重要挑战，调研结果词云如下所示，包括边缘AI概念与定义、硬件方案、人才协作、工具与文档、场景需求、AI效果等24条意见，由于篇幅限制不一一阐述。

3、边缘AI服务开发者

本问卷中，边缘AI服务开发者是指，在给定算法基础上开发工业、Re-ID、能源、机器人等边缘AI服务的角色。有74.90%的调研对象填写了边缘AI服务开发者相关问卷调研选项。对每个挑战的负面影响有四种选项，包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。

本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果，本章末尾将小结各不同维度的结论。

3.1平均分

若选择“不了解跳过”或“可维持现状”记为0分，“建议改进”记为5分，“亟需改进”记为10分，答卷中对边缘AI服务开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.24分，问卷中所罗列的各挑战都超过了5分，可以认为各挑战都有改进的需求。

其中，平均分值最高（6.76分）的挑战是：

“通用方案整体性能不一定满足特定业务需求”

在截尾均值6.09分以上的其它头部挑战还包括：

“自研业务算法和系统方案周期长成本高”
“方案效果复现困难或通用方案应用范围存疑”

从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象（三者在调研对象中的比例大致为2:1:1），细化服务开发者各项挑战平均分：

“边缘AI及其应用”方向下各职业平均分值最高的服务开发挑战完全一致：

工业界：“通用方案整体性能不一定满足特定业务需求” （平均分7.1）
学术界：“通用方案整体性能不一定满足特定业务需求” （平均分7.8）
在校学生：“通用方案整体性能不一定满足特定业务需求”（平均分7.5）

在截距均值以上的其它头部挑战还包括：

工业界（截距均值5.99）：

“自研业务算法和系统方案周期长成本高”（平均分6.63）
“方案效果复现困难或通用方案应用范围存疑”（平均分6.1）

学术界（截距均值5.75）：

“自研业务算法和系统方案周期长成本高”（平均分7.00）
“方案效果复现困难或通用方案应用范围存疑”（平均分6.60）

在校学生（截距均值5.84）：

“方案效果复现困难或通用方案应用范围存疑”（平均分6.88）
“自研业务算法和系统方案周期长成本高”（平均分6.46）

3.2亟需改进

对于边缘AI服务开发者，问卷中提及的挑战被选为“亟需改进”的比例都在20%以上，高于“还有其他重要挑战”的6.36%，可以认为各个挑战都有一定的迫切需求。

其中被选为“亟需改进”的挑战中比例最高（36.78%）的是：

“通用方案整体性能不一定满足特定业务需求”

在截尾均值（25.57%）以上的其它头部挑战还包括：

“自研业务算法和系统方案周期长成本高”
“现场人员只会开关机，希望简化现场安装部署”

与“平均分”维度相比，“亟需改进”维度头部部分选项排名有变化。

1、在“亟需改进”维度才进入头部的挑战有一个，在“平均分”部分其实也是非常接近头部（距离截尾均值0.06），这可能说明该挑战比较重要，而且需求比较迫切，这个挑战是：

“现场人员只会开关机，希望简化现场安装部署”

2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降，意味着其有一定的重要性，但相对紧急程度较低，可能是“重要不紧急”的、更为“长远”的需求，这个挑战是：

“方案效果复现困难或通用方案应用范围存疑”

3.3可改进

问卷中的绝大部分挑战都以较大比例（59.77% - 68.96% ）被选为“建议改进”和“亟需改进”（下总称“可改进”），对比认为“有其他重要挑战”需改进的比例仅为10.92%，说明列举在问卷中相关挑战大部分都明显有改进的需求。

其中，被认为“可改进”的挑战中比例最高（68.96%）的是：

“通用方案整体性能不一定满足特定业务需求”

在截尾均值（61.78%）以上的其它头部挑战还包括：

“自研业务算法和系统方案周期长成本高”
“方案效果复现困难或通用方案应用范围存疑”

与“亟需改进”相比，“可改进”维度头部部分选项排名有变化。

1、在“可改进”维度头部选项中，比“亟需改进”排名更高的挑战，可以认为是有一定的重要性，但相对不那么紧急，看上去更“长远”的“重要不紧急”挑战包括：

“方案效果复现困难或通用方案应用范围存疑”

这与“亟需改进”章节结论一致。

“现场人员只会开关机，希望简化现场安装部署”

这与“亟需改进”章节结论一致。

3.4小结

对边缘AI服务开发者有以下结论：

1.平均分值最高（6.76分）的挑战是：“通用方案整体性能不一定满足特定业务需求”

2.头部重要挑战中

“重要不紧急”头部重要挑战包括：“方案效果复现困难或通用方案应用范围存疑”
“重要且紧急”头部重要挑战包括：“现场人员只会开关机，希望简化现场安装部署”
头部重要挑战还包括：“自研业务算法和系统方案周期长成本高”

3.“边缘AI及其应用”方向下服务开发各职业平均分值最高的生态挑战完全一致：

工业界：“通用方案整体性能不一定满足特定业务需求” （平均分7.1）
学术界：“通用方案整体性能不一定满足特定业务需求” （平均分7.8）
在校学生：“通用方案整体性能不一定满足特定业务需求”（平均分7.5）

问卷中也尝试调研边缘AI服务开发其余重要挑战，调研结果词云如下所示。包括场景定制化、培训与指南、部署安装、硬件资源、技术方案等18条挑战，由于篇幅原因不一一阐述。

4、边缘AI技术布道者

本问卷中，边缘AI技术布道者是指开展边缘AI技术演讲布道，推广甚至销售现有边缘AI技术与服务的角色。有69.94%调研对象填写了边缘AI技术布道者相关问卷调研选项。对每个挑战的负面影响有四种选项，包括“不了解可跳过”“可维持现状”“建议改进”“亟需改进”。

本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果，本章末尾将小结各不同维度的结论。

4.1平均分

若选择“不了解跳过”或“可维持现状”记为0分，“建议改进”记为5分，“亟需改进”记为10分，答卷中对边缘AI技术布道者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的0.73分，问卷中所罗列的各挑战都超过了5分，可以认为各挑战都有改进的需求。

其中，平均分值最高（6.61分）的挑战是：

“缺乏商业成功案例”

在截尾均值5.77分以上的其它头部挑战还包括：

“缺乏与现有方案系统对比，包括成本、部署要求”
“受众对边缘AI不了解”

从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象（三者在调研对象中的比例大致为2:1:1），细化技术布道者各项挑战平均分：

“边缘AI及其应用”方向下各职业平均分值最高的技术布道挑战分别是：

工业界：“缺乏与现有方案系统对比，包括成本、部署要求” （平均分6.63）
学术界：“缺乏商业成功案例” （平均分6.59）
在校学生：“受众对边缘AI不了解”（平均分6.25）

在截距均值以上的其它头部挑战还包括：

工业界（截距均值5.98）：

“受众对边缘AI不了解”（平均分6.15）
“缺乏商业成功案例”（平均分6.43）

学术界（截距均值5.40）：

“受众对边缘AI不了解”（平均分5.91）
“缺乏与现有方案系统对比，包括成本、部署要求”（平均分5.68）

在校学生（截距均值5.46）：

“缺乏商业成功案例”（平均分6.05）
“缺乏直观的UI界面和Demo”（平均分6.05）
“缺乏与现有方案系统对比，包括成本、部署要求”（平均分5.53）

4.2亟需改进

对于边缘AI技术布道者，问卷中提及的挑战被选为“亟需改进”的比例都在20%以上，高于“还有其他重要挑战”的1.72%，可以认为各个挑战都有一定的迫切需求。

其中被选为“亟需改进”的挑战中比例最高（32.18%）的是：

“缺乏商业成功案例”

在截尾均值（25.00%）以上的其它头部挑战还包括：

“缺乏与现有方案系统对比，包括成本、部署要求”
“缺乏直观的UI界面和DEMO”

与“平均分”维度相比，“亟需改进”维度头部部分选项排名有变化。

1、在“亟需改进”维度才进入头部的挑战有一个，在“平均分”部分其实也是非常接近头部（距离截尾均值0.06），这可能说明该挑战比较重要，而且需求比较迫切。这个“重要且紧急”挑战是：

“缺乏直观的UI界面和DEMO”

2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降，意味着其有一定的重要性，但相对紧急程度较低，更为“长远”的需求。这个“重要不紧急”挑战是：

“受众对边缘AI不了解”

4.3可改进

问卷中的绝大部分挑战都以较大比例（54.02% - 62.07%）被选为“建议改进”和“亟需改进”（下总称“可改进”），对比认为“有其他重要挑战”需改进的比例仅为6.89%，说明列举在问卷中相关挑战大部分都明显有改进的需求。

其中，被认为“可改进”的挑战中比例最高（62.07%）的是：

“缺乏商业成功案例”

在截尾均值（57.61%）以上的其它头部挑战还包括：

“缺乏与现有方案系统对比，包括成本、部署要求”
“受众对边缘AI不了解”

与“亟需改进”相比，“可改进”维度头部部分选项排名有变化。

1、在“可改进”维度头部选项中，比“亟需改进”排名更高的挑战，可以认为是有一定的重要性，但相对不那么紧急，看上去更“长远”的挑战包括：

“受众对边缘AI不了解”

这与“亟需改进”章节结论一致。

“缺乏直观的UI界面和DEMO”

这与“亟需改进”章节结论一致。

4.4小结

对边缘AI技术布道者有以下结论：

1.平均分值最高（6.61分）的挑战是： “缺乏商业成功案例”

2.其它头部重要挑战中

“重要不紧急”头部重要挑战包括： “受众对边缘AI不了解”
“重要且紧急”头部重要挑战包括： “缺乏直观的UI界面和DEMO”
头部重要挑战还包括：“缺乏与现有方案系统对比，包括成本、部署要求”

3.“边缘AI及其应用”方向下技术布道各职业平均分值最高的生态挑战分别是：

工业界：“缺乏与现有方案系统对比，包括成本、部署要求” （平均分6.63）
学术界：“缺乏商业成功案例” （平均分6.59）
在校学生：“受众对边缘AI不了解”（平均分6.25）

问卷中也尝试调研边缘AI技术布道其余重要挑战，调研结果词云如下所示。包括边缘AI价值和方案配套等7条意见，由于篇幅原因不一一阐述。

5、未来工作

作为KubeEdge社区SIG AI重要成员，华为云边缘云创新实验室将依据调研结果有针对性地向KubeEdge社区SIG AI持续贡献。KubeEdge是业界首个云原生边缘计算框架、当前云原生计算基金会内部唯一孵化级边缘计算开源项目。KubeEdge在全球已拥有800+贡献者和60+贡献组织，在Github获得4.6k+Stars和1.3k+Forks。作为KubeEdge中唯一的AI特别兴趣小组（Special Interest Group），KubeEdge社区SIG AI致力于使能AI应用在边缘更好地运行，聚焦边缘AI技术讨论、API定义、参考架构、开源实现等。为全球开发者提供相关研发支持并孵化繁荣生态，当前已开源边缘AI平台Sedna，包括其跨边云的协同推理、联邦学习、增量学习和终身学习特性。

作为信奉开源文化的社区，KubeEdge始终都强调“Best ideas win”，领域发展自然也不例外。为了交出一个更有竞争力和创意的提案，本次调研了解每位关注开源与边缘AI的朋友对相关方案落地过程遇到的困难，然后选取Best idea，对社区内容进行优化，以便为大家呈现一个体现开源开放精神的资源分享社区生态。

除了之前章节提及的内容，问卷中还包括调研对象的建议。其中“提供公开数据集、预处理和基线代码，构建Benchmark”的建议无论在总览、还是在边缘AI方向的工业界、学术界和在校学生中票数均排名第一，比例分别为82.18%、92.98%、87.10%、86.67%，并且显著高于其它建议，相信此建议需要重点关注。社区也可以根据上面的阐述细分相关职业需求，进一步优化边缘AI生态。

问卷也尝试调研其余重要建议。包括场景演示和研发支撑等8条建议：

场景演示

增加demo展示
深入了解行业落地痛点
找准一个典型领域或场景进行全方案的落地测试，包括训练和推理结合实际业务形成一套端到端的解决方案
光调研开发者不足够，并非方案用户，要落地还得调研边缘AI的最终客户需求

研发支撑

最重要还是数据公开
希望能提供更多的例子，示例怎么完成一个任务的训练和部署。联邦学习目前了解的人比较少，希望对它的优势和使用方法做更多介绍，降低系统使用门槛。
需要对相关开源平台的了解，也可以搞合作
提供更多的开发者使用模式，不局限于现在example

路遥共相伴，勠力同向前。特别感谢参与答卷的专家、学者和同学，本次调研的四大“意见领袖”与十佳“优秀意见”等各项评选正在有序进行，并将陆续发放报告和纪念品。结合行业关注的最新技术趋势，KubeEdge将集结当前SIG AI中30+单位的各供应商和开发者为边缘AI算法开发者、服务开发者、技术布道者三种角色提供资源和平台帮助。这将包括数据集开源、预处理与范式算法开源、以及AI工具等行业内迫切需要的资源，为大家带来一场开源饕餮盛宴。相关内容将陆续到来！欢迎关注KubeEdge 社区https://github.com/kubeedge/ 、KubeEdge SIG AI及其项目Sedna https://github.com/kubeedge/sedna。

点击关注，第一时间了解华为云新鲜技术~

以上是关于边缘AI研发落地生态挑战调研报告发布的主要内容，如果未能解决你的问题，请参考以下文章

第五期（2022-2023）传统行业云原生技术落地调研报告——金融篇