工业AI落地的心酸泪
Posted QtHalcon
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了工业AI落地的心酸泪相关的知识,希望对你有一定的参考价值。
这几年AI大火,在数字经济不断推进的大背景下,人工智能发展迅速,并与多种应用场景深度融合。在计算机视觉方面也成就了很多优秀的公司,如商汤科技、旷视科技、云从科技和依图科技。但是看了AI的应用场景分布时,不由得为之一惊,足以证明AI技术在工业上应用真是艰难。
一、了解AI
1.1 AI本质
世界上所有事物发展都是有客观规律,大致的模型如下:
AI的学习进步靠的是程序员码上的if语句。AI自主学习就是自己在代码片段上码几行if语句,以下就是一个初级的AI。
order = input();
if (order == "你吃饭了吗?") {
std::out<<"吃了";
}
如果要让它更智能,那就要给它给更多if,更多客观规律,这样便能处理更多情况。而深度学习技术使得计算机可以从海量的案例中通过训练归纳总结出其内在规律。
1.2 AI的分类
当前AI主要研究方向,是计算机视觉,自然语言处理,数据挖掘。
计算机视觉就包括图像识别,视频识别,具体应用有人脸识别,步态识别,无人驾驶汽车等等。
自然语言处理包括机器翻译,语音识别,文本挖掘等等,像siri,谷歌翻译里面都有很多的自然语言处理技术。
数据挖掘主要是各种推荐和预测,包括电子商务的商品推荐,计算广告,社交网络分析(微博好友推荐等),预测一些趋势,比如股市的走向,天气的变化等。
以下是大型科技公司在AI上的产业分布。
1.3 AI的关键要素
每一个AI项目都逃不了这三个要素:
-
海量的数据:计算机无法理解和识别客观世界的规律,它需要海量的数据作为样本进行训练。人脸识别需要计算机大量在观看了大量的人脸照片,机器故障的识别和预测也需要读取海量的监控数据。
-
充足的算力:AI需要极高的算力,应为要处理和分析海量的数据。我们一般给客户的硬件配置是i7 + GTX1080Ti。
-
合适的模型:机器学习有监督学习、无监督学习等多达几十种算法模型,每一个模型均有大量的参数需要配置。机器判断的准确性高度依赖于选择正确的算法和参数的配置。
二、工业AI的痛点
2.1 工艺指标
拿我朋友之前做过的一个皮革检测来举例,以下是它的检测指标:
皱纹、污损、滴油、炉渣、失宽折边、包气起泡、垫伤、杂质、破孔、轮伤、失料、沾处理剂、处理不良、印刷不良、拖线、顿刀、排骨纹、过发、缺口、压花不良、压纹浅、麻面、粗粒、胶化不良、贴合不良、研磨不良、生料、色条、白点、色条亮条、布折纹、上糊折纹、贴合折纹、水波纹、接头、拉伸、黑点、贴合、破面、裁边不良、布毛、脱胶、划伤、龟裂。
几十项检测指标,每一项都达到检测标准,并且精度还要控制在0.1mm以内,这还不包括所有指标,以及未来有可能出现的新指标。
这么多指标就需要更多的数据进行分析,项目周期也拉的很长。
2.2 计算速度
首先是了解需求,然后根据需求和产品来进行打光测试,等到实际运行测试时,发现检测一个产品竟然要7、8秒。这对于客户来说是无法接受的,在很多工厂生成产品都是流水线模式,你的机器不能影响整条流水线的速度,可能你对接的其他机器处理一个产品只要半秒中,那你也要控制在半秒内。
提高计算速度,首先把配置提高,其次是极高算法处理速度,优化AI模型。
2.3 正确率
前面说AI都是需要通过海量的数据进行分析,但是谁也不能保证,我们的模型已经学习了所有情况,能够正确分析所有产品的指标。而且有的产品就算是人也无法分辨是否NG。
但是对于工业制造来说,很多产品都是不允许出错的,像之前给华为做的铁氧体检测,那都是要把正确率控制在99%以上的。
2.4 量产
想要将视觉产品量产先要实现以下要求:
-
是否能应对每一个工艺要求。
-
计算速度是否能达到要求,是否比人工快。
-
正确率是否能控制在要求内。
-
是否提供了良好的训练环境。
-
软件UI界面是否方便简洁。
-
产品的价格是否满意。
-
产品本身是否可以大量复制。
有时候在热火朝天、干劲十足的准备成百上千套变现的时候,客户说:抱歉,只要一套。
三、怎样更好的落地
3.1 需求分析
从项目本身来看,哪些问题确实只能用AI来解决,除了AI有没有可以替代的方案。产品本身有哪些标准衡量,这个项目是否有足够的人力物力财力来支撑。该项目有哪些风险。
从客户角度来看,这个项目是否值得去做,是不是符合他们公司的发展,相关部门是否了解需求并且支持该项目。
从行业来看,这个项目是否已经被其他公司做过,或成功或失败。该项目所涉及到的技术是否可以推广到其他项目中。
3.2 制定合适的方案
选用什么硬件。通过打光测试选取相应的相机、光源和镜头等。CPU、显卡选用哪个型号。
选择什么深度学习框架,通过分析需求选取合适的框架。
硬件,软件,系统都要确定清楚。
3.3 部署方案
方案的运行流程是,采集数据集,导入数据集,构建模型,训练,验证。
模型构建是人工智能的核心任务,把具体问题抽象成为某一类问题并用数学模型表示。使用训练数据和管理参数来实施迭代测试,使得模型准确性更高。
训练和调优计算密度最高的部分,这个过程不仅耗算力,也耗人力,不仅需要机器自己算。很多时候也需要人为来手动调整数据,并执行数千次百次实验。
3.4 项目总结
项目如果验证OK,那就分析它是否完备,如果数据需求或模型变化,能否适应不断变化的环境。能否简单快捷地调试训练模型中的错误输出?
就本质而言,许多AI项目都要求系统实时执行推理,而不是在离线或批处理模式下执行。此外,随着时间推移,可能需要重新训练并更新模型。这些因素对服务交付提出了一些额外要求。要确保预先分配了足够的时间和技能资源,以便继续提供概念验证。
要将AI快速落地到各种工业场景还是相对困难,只有不断学习新的技术,不断寻求突破,才能让AI在工业中大展拳脚。
以上是关于工业AI落地的心酸泪的主要内容,如果未能解决你的问题,请参考以下文章
寒武纪与百度飞桨Paddle Lite完成适配 加速AI多场景落地