华软资本黄宇星丨AI篇:图像识别技术让生活更加智能
Posted 华软资本
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了华软资本黄宇星丨AI篇:图像识别技术让生活更加智能相关的知识,希望对你有一定的参考价值。
文/华软资本高级投资经理 黄宇星
从1952年会下井字棋、1996年“深蓝”赢了国际象棋、到2016年AlphaGo战胜人类围棋世界冠军,机器学习的提升速度看似要比人类智力进化快了许多,人工智能也逐步成为人们关注的热点领域。从语音识别、图像识别,到无人机、无人驾驶汽车等,人工智能正不断地对我们生活中各个行业产生变革性的影响,并推动着产业升级。
视觉是人脑最主要的信息来源,人脑每天接受的外部信息中,视觉信息占83%。因此,人工智能想拥有类人智能,能够“看到”外部世界并“看懂”至关重要。近年来,图像识别技术的发展迅速,图像识别准确度在近八年间提升十倍,并已经广泛运用于人脸识别、移动支付、安防等领域,成为智能生活中密不可分的一部分。
本文作者希望通过本文让大家对AI图像识别有更深的理解,拓宽思路,利用AI图像识别技术解决更多生活中的问题,助力产业智能化发展。
根据人工智能形成的不同阶段,可将人工智能分为三个层次:
Figure 1:资料来源:平安证券研究院
基础层:
指支撑人工智能运行的基础设施,主要分为硬件和软件两类。硬件主要包括前端信息、数据采集用的传感器,数据处理、计算用的CPU和GPU等。软件包括实现人工智能的相关算法,如深度学习算法、数据挖掘算法、认知计算系统等。
技术层:
指在基础支撑层提供的软硬件基础之上,为了适应不同的细分应用领域,有针对性开展的技术应用。主要包括语音识别、图像识别、自然语言处理等。
应用层:
指为了满足不同行业的智能需求,将不同细分领域的AI技术进行完善,形成较大领域的综合解决方案。比如智慧城市、智慧金融、智慧安防等。
图像识别技术属于人工智能发展阶段中的感知智能阶段,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。一般采用工业相机拍摄图片,然后再利用软件根据图像灰阶差做进一步识别处理。
图像识别的原理主要是需要处理具有一定复杂性的信号,并结合计算机程序对相关内容模拟并予以实现。图像识别技术在计算机上实现和人类对图像识别的基本原理基本类似,只是计算机不会受到类似人类感觉及视觉等方面的影响。计算机采用对图像重要特征的分类和提取,并有效排除冗余特征信息,从而实现图像识别。
利用图像识别的过程与人脑识别图像的过程大体一致,主要分为以下四个步骤:
1、获取信息:
将声音和光等信息通过传感器向电信号转换,对识别对象的基本信息进行获取,然后转换成适合计算机处理的形式。
2、信息预处理:
利用去燥、变换及平滑等操作对图像进行处理,改善图像质量。
3、特征提取:
指抽取和选择图像特征,识别图像具有种类多样的特点,采用一定方式进行分离,便于分类。
4、判别分类:
根据机器学习对识别规则进行制定,进而使图像识别不断提高辨识率,最终实现对图像的分类识别。
其实,图像识别的原理并不复杂,但是世界上有无数种物体,人为地分析归纳每一种物体是不现实的。所以,如何让机器自动归纳物品的特征,然后通过训练自主建立识别逻辑成为了需要不断攻克的问题。
图像识别按识别对象不同可分为三大类:生物特征识别、物体与场景识别、视频识别。
1、生物特征识别:
生物特征识别技术是一种通过对人的生理特征或生物特征的识别和检测,来进行个人身份鉴定的技术。主要包括人脸识别、指纹识别、虹膜识别等方式。
在该领域,指纹识别的门槛相对较低且易研发,目前使用最为普遍。未来人脸识别和虹膜识别这种非接触性,其有高精确性和难复制特点的识别技术将迎来更为广大的发展潜力。
2、物体与场景识别:
人眼看事物首先是通过眼睛对食物进行捕捉和收入,然后把信息传送到大脑,主要是对三维世界的物体及环境的感知和认识。
目前物体识别技术在研发的早期阶段,这个领域很多公司着力于给不同图片打标签,帮助机器学习同类物体的不同形态,用大数据量来帮助训练物体识别算法的精度。
3、视频识别:
在进行视频识别与分析时,需要前端摄像头设备来手机和传输数据,同时,需要通过大数据训练、具备云计算能力的深度学习图像分析系统来实时进行视频检测和数据分析。
图像识别作为人工智能行业的一个细分领域,它的产业链是和人工智能的结构层级对应的。上游是硬件层,包含高清摄像头、芯片等硬件供应商,负责采集、分析、存储数据,中游是技术层,一般是由图像识别软件供应商提供服务,下游则是垂直领域解决方案的提供商。
图像识别技术的发展主要依赖于硬件芯片的提升和图像识别算法的改进。
硬件层和软件开发是整个图像识别系统中的绝对核心环节,其中软件和底层算法是主要技术壁垒。
目前国内企业大多集中在应用层,主要依靠掌握不同下游应用环境的Know-how做出适应性产品。由于国内产业智能化发展较晚,大多初创企业在软件和底层算法领域还是处于研发阶段,该领域主要是被例如康耐视、基恩士、MVTec等外资企业所垄断。
在上游领域,深度摄像头是图像识别技术向深处发展的基础。高性能芯片也是图像识别行业产业链中重要环节,其强大的计算能力助力图像识别技术突破计算能力不足的瓶颈。
图像识别的基础是图像、视频数据的收集,因此,摄像头作为图像识别的基础设备,在图像和视频的收集上起到基础性硬件方面的作用。目前国内深度相机还是以进口为主,比如德国Basler,日本基恩士、美国康耐视在该领域有着绝对的优势,国产品牌从低端市场开始逐步进口替代,未来存在巨大的国产化替代空间。
在图像识别过程中涉及的图像和视频都是数据密集型问题,需要大量的数据匹配和运算资源,传统的CPU芯片不能满足深度学习算法和大数据处理的需求,而GPU(图像处理器)是专门为执行复杂的数学和几何计算而设计的,其在不同应用场景下相对CPU具有较高的加速倍数,在视频搜索时达到20倍、运动目标侦测达到15倍、人脸识别时达到7倍。
而在产业链中游环节,图像处理软件基本处于被国外企业垄断状态,国内初创企业针对不同应用环境的二次开发过程中存在发展机遇。
在国内,目前比较流行的模式是“软件平台+视觉开发包”,软件工程师给可以调用开源的算法实现对各种复杂图像的处理功能,降低二次开发难度和工作量。
目前国际上主要的图像处理软件平台是康耐视的VisionPro和MVTec的Halcon。
尽管还未达到真正的人工智能,但日渐成熟的图像识别技术已开始探索各类行业的应用,主要有金融领域、安防领域和医疗领域等。
金融领域:图像识别在银行精通领域的应用是人证核验;手机内置影像识别芯片逐渐成为智能手机厂商差异化的增长点之一。
金融是人工智能重要的应用场景,人工智能在金融行业的应用改变了金融服务行业的规则。传统金融机构与科技公司共同参与,构建起更大范围的高性能动态生态系统,参与者需要与外部各方广泛互动,获取各自所需要的资源,因此在金融科技生态系统中,金融机构与科技公司之间将形成一种深层次的信任与合作关系,提升金融公司的商业效能。其中,身份识别和智能支付是图像识别重要的应用方向,比如,在传统金融中,用户在申请银行贷款或证券开户时,均必须到实体门店上做身份信息核实,完成面签。如今,通过人脸识别技术,用户只需要打开手机摄像头,自拍一张照片,系统将会做一个活体检测,并进行一系列的验证、匹配和判定,最终会判断这个照片是否是用户本人操作,完成身份核实。
安防领域:安防对图像识别正确率敏感度较低,需求大且对价格变化不敏感,落地较为成熟。
图像识别在安防领域的应用走在前面,商业化变现途径最为清晰,大部分图像识别公司开始都会选择安防作为突破口。政府是智能安防的主体,受益于我国的平安城市和智慧交通战略,道路交通、海关边检等对视频监控需求量大,且G端安防需求较为一致,安防方案可以规模化拓展。另外智能安防从专业化市场向民用市场渗透。
安防行业智能化加速,进入人工智能时代,摄像头高清化、智能化、后端分析软件升级,人脸识别和视频监控是智能安防的核心,云边融合是智能安防未来发展趋势,海量高清视频传输占用宽带资源,云边结合将智能算法前置,在摄像机安装智能芯片,通过边缘计算将人脸识别等应用的抓图压力分摊到前端,解放中心的计算资源。
目前多省市建立人脸库实现了静态人脸识别,随着误识率仍十万分之一到未来百万分之一甚至更低,动态人脸识别技术成熟,人脸识别将是安防智能化的重要技术支撑。在动态图像识别领域中,行为识别和视频识别常常用于监狱的监控,视频监控和识别常用于平安城市和车辆识别。
医疗领域:医疗影像识别市场潜力大,但是对错误的容忍度较低,还需经历较长的发展过程。
医疗影像识别对准确度要求高,在单一病种上取得突破,数据获取和标注是发展瓶颈。医疗影像医疗数据中有80%来自医疗影像。医学影像以静态图像识别为主,相对于视频处理技术要更加成熟。根据互联网医疗联盟,医疗影像数据年增长率63%,放射科医生数量年增长率2%,放射科医生供给缺口很大。在AI+医疗领域,AI医疗影像识别获投资占比最大。
医疗影像识别对识别错误的容忍度较低,目前医疗影像识别主要集中在单一病种如肺结节等,以及单一设备如CT影像,未来需要突破单一病种和单一设备成像限制,医疗影像数据的获取是个难题,尤其是医疗影像标注需要专业医生来进行,已标注医疗数据缺乏获取困难。
目前国内图像识别下游应用公司中,已经诞生了不少“独角兽”企业,主要有:
旷视科技(Face++):
主要设计人脸检测、人脸识别和面部分析,是国内领先的人脸识别技术提供商。产品有:与蚂蚁金服合作推出刷脸支付;与小米合作推出进程开户认证;与联想之星合作建设智能门禁系统。
商汤科技:
主要涉及人脸识别、车辆识别、物体识别,是业界领先的图像识别公司。产品有:和京东钱包推出刷脸解锁;和东方网力在人群分析、人体跨摄像头追踪等视频智能分析合作。
云从科技:
主要涉及人脸识别,拥有自主知识产权核心算法,是人脸识别国家标准起草与制定企业。产品有:与中国农业银行合作推出超级柜台人脸识别。
依图科技:
主要涉及人脸识别、车辆识别和视频识别,是一家致力于将先进的人工智能技术与行业应用相结合的创业公司。主要产品是智能安防平台,包括了人像大平台和车辆大平台。
图像识别技术作为AI的一个重要细分领域,虽然是刚兴起的技术,但其在各行各业中的应用已经相当广泛。随着近些年互联网巨头在该行业的不断加码,未来随着图像识别技术将会更加强大,为我们智能化生活带来更大的便利。
以上是关于华软资本黄宇星丨AI篇:图像识别技术让生活更加智能的主要内容,如果未能解决你的问题,请参考以下文章
想要图像识别的准?有效提升AI数据精度是关键
如何快速成为图像识别大神?英伟达专家带你低门槛高效实现AI模型训练与部署 | 英伟达CV公开课
数据标注丨小鸽带你走进AI图像识别
AI|图像识别技术究竟能在商业世界掀起多大波澜?
华苏科技电力行业图像识别系统,推进电力运检智能化
AI人脸检测智能分析网关算法模型管理,支持自由组合算法