人工智能—我们与影视作品的距离还有多远 ?

Posted 一办综合办公室

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了人工智能—我们与影视作品的距离还有多远 ?相关的知识,希望对你有一定的参考价值。

说到人工智能,让我想起2001年史蒂文·斯皮尔伯格执导的电影《人工智能》。


电影中小男孩大卫是第一个被输入情感程序的机器男孩。大卫被设定为一生只爱领养了他的“妈妈”莫妮卡。在莫妮卡的儿子苏醒之后回到家中发生的一系列事情,导致了莫妮卡对大卫产生误会,最终被莫妮卡抛弃。为了重回莫妮卡的身边,变成真正的小孩,大卫走上了寻找自己人生价值的路程。


人工智能—我们与影视作品的距离还有多远 ?


人工智能从诞生到现在已经有70年的历史了,中间几经波折,神经网络算法的一次次突破总是带给人工智能一次次进步。


1


人工智能的历史


人工智能的概念最初是由图灵提出的。


图灵提出:如果一台机器能够与人类对话而不被辨别出机器的身份,那么这台机器就具有了智能的特性。


01

AI诞生


1956年,以明斯基和麦卡锡为代表的来自不同学科的科学家,在美国达特茅斯学院的一次会议上正式确立了人工智能的研究学科


02

第一次发展高潮(1955年—1974年)


达特茅斯会议之后是人工智能的大发展时期,也是人工智能的第一次高潮。这一时期,提出了第一款神经网络模型和启发式学习算法。


03

第一次寒冬(1974年—1980年)


到了70年代,AI的研究遇到瓶颈,加之由于前期人们对AI的期望过高,导致后期不满情绪增加。许多机构开始不断减少对人工智能研究的资助,直至停止资助。


04

第二次发展高潮(1980年—1987年)


80年代初,由于一类名为“专家系统”的AI程序开始为世界上的公司所采纳,人工智能迎来了第二次发展高潮。这一时期BP算法也被提出,实现了神经网络训练的突破,神经网络的研究也受到广泛关注。


05

第二次寒冬(1987年—1993年)


1987年,由于AI硬件的需求下降,人工智能经历了第二次的寒冬。专家系统虽然好用,但是应用领域狭窄,更新和维护成本也很高。


06

第三次发展高潮(1993年至今)


90年代后,在摩尔定律下,计算机性能不断提升,云计算、大数据、机器学习、自然语言处理和机器视觉等领域的发展,人工智能迎来了第三次高潮。


2006年,Geoffrey Hinton 提出深度信念网络用于在深度神经网络的训练。


2016年-2017年,“Alpha Go”在围棋比赛中,战胜人类围棋高手“李世石”和“柯洁”,人工智能进入爆发时期。我国也将人工智能纳入国家发展战略之中。


最近上线的史上最大人工智能模型GPT-3,模型拥有1750亿个参数,占用300G存储,由45TB数据训练而成,虽然相比于一个成年人类100TB的脑容量还有一定差距,但它已经可以陪你聊词品曲畅谈人生哲理了。甚至还可以编程、画表、写文、做数学题。与2月份刚刚上线的全球最大网络模型Turing NLP相比还要大上10倍。


人工智能—我们与影视作品的距离还有多远 ?


如此之快的迭代速度,未来人工智能的发展可想而知。很多专家学者也对此次浪潮给予肯定,认为此次人工智能的浪潮很可能引起第四次的工业革命。人工智能也将引起教育医疗,交通娱乐,保险金融等众多行业的变革。


2018年,在中国人工智能行业创新Top100排行榜中,华大基因超过科大讯飞,位列第四。作为全球最大的基因组学研究机构之一的华大基因,也已在人工智能领域早早布局,像SNP检测、抗原/抗体检测、蛋白质结构预测和单分子测序等,都是人工智能在生物领域的应用。未来基因大数据的破解带来的不仅是价值千亿、万亿的产业,也将会对深刻影响人们思想、观念以及对自身的认识。希望到时我们都可以享受人工智能带来的科技福利,而不只是少数人的特权。


那么,什么是人工智能?引起这次人工智能浪潮的深度学习算法又是什么呢?


2


什么是人工智能


01

定义


人工智能是研究、开发用于模拟延伸人智能的理论、方法和技术,它企图理解人类智能的实质,制造出能以人类相似方式做出反应的智能机器;


它涉及机器人、语言识别、图像识别、自然语言识别和专家系统等领域;


它是对人的意识、思维过程的模拟,它不是人的智能,但是能像人一样思考,还可能会超过人类的智能。


人工智能—我们与影视作品的距离还有多远 ?


02

分类


弱人工智能:指专攻某一领域的人工智能,像Siri,围棋比赛中的AlphaGo;


通用人工智能:指具有一般人类智能水平,能解决人类能解决的任何智力问题的智能机器;


超人工智能:在几乎所有领域,比最优秀的人类大脑还要聪明。


03

三大学派


人工智能—我们与影视作品的距离还有多远 ?


符号学派:模拟人的心智,认为人工智能源于数理逻辑,通过计算机可以研究人的思维过程,模拟人类的智能活动,代表人物有西蒙(Simon);


联结学派:模拟脑的结构,认为人工智能起源于仿生学,是对人脑模型的研究,代表人物明斯基(Minsky );


行为学派:模仿人的行为,认为人工智能源于控制论,通过把神经系统的工作原理与信息理论、控制理论等联系起来,来实现自寻优、自适应、自组织和自学习的系统,代表人物有维纳(Wiener);


3


人工智能之深度学习


深度学习是机器学习领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。


深度学习是一类模式分析方法的统称。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。


人工智能—我们与影视作品的距离还有多远 ?


01

深度学习的发展


人工智能—我们与影视作品的距离还有多远 ?


1943年,生理学家McCulloch和数理逻辑学家Pitts 创立了神经元的数学模型,即MP模型


1958年,Rosenblatt 提出了第一代的神经网络单层感知器,能够区分三角形、正方形等基本形状,但单层感知器的神经网络连逻辑中简单的异或问题都不能解决,神经网络也随着人工智能消沉一段时间。


1986年,Hinton等提出第二代神经网络,将之前单一固定的特征层替换为多个隐含层,采用Sigmoid激活函数,通过反向传播算法,有效的解决了非线性分类问题,Cybenko和Hornik等也在1989年证明了:任何函数都可以用一个单隐层的神经网络以任意精度逼近。


同年,LeCun等发明了卷积网络算法用于手写字的识别。卷积神经网络是一种处理局部和整体相关性的网络结构,通常被应用于图像识别、自然语言识别以及语音识别领域,因为图像数据具有显著的局部与整体的关系。


1991年,由于反向传播算法被指出存在梯度消失的问题。此后十多年,神经网络局限于浅层网络的研究,支持向量机等浅层网络被用于各种现实问题应用中,而深层网络的研究被搁置。


2006年,Hinton等探讨大脑的图模型,提出了深度信念网络用于预训练深度网络的,来解决深度网络梯度消失的问题。


2010年,美国国防部计划首次资助深度学习项目。


2011年,Glorot 等提出ReLU 激活函数,有效的抑制了梯度消失的问题。深度学习首先在语音识别和图像识别领域取得重大突破。2011年,微软和谷歌先后采用深度学习将语音识别错误率降低至20%-30%。


2012年,Hinton和它的学生将ImageNet 图片分类的错误率从26%降低至15%。此后,深度学习进入爆发期。


后来,Dauphindeng 等,CHoromanska等分别在2014年、2015年独立证明了局部极小值问题通常不是严重的问题,消除了笼罩在神经网络上的阴霾


02

深度学习的典型模型



1、人工神经网络模型


多层感知器中的特征神经元模型称为感知机,简单的单感知机分类器如下所示:


人工智能—我们与影视作品的距离还有多远 ?


x1,x2,x3为输入,w1,w2,w3为权重,f为激活函数,当输入的加权和通过激活函数的值大于某一阈值时,输出为正,否则为负,由简单的感知机可以构成复杂的多层感知器。


神经网络的训练通过后向传播算法(BP)来实现。


人工智能—我们与影视作品的距离还有多远 ?


2、深度信任网络模型


深度信念网络(DBN)是2006年 Hintion 为了解决深度网络模型难以训练的问题提出的。一个DBN 模型由若干个RBM 构成,训练时由低到高逐层进行预训练提取特征。

人工智能—我们与影视作品的距离还有多远 ?


深度信念网络(DBN)是一种无监督的逐层预训练的方法,可应用在很多方面,像自编码网络、去噪网络和稀疏核机等。


人工智能—我们与影视作品的距离还有多远 ?


3、卷积神经网络模型


卷积神经网络是一种处理局部和整体相关性的网络结构,通常被应用于图像识别、自然语言识别以及语音识别领域,因为图像数据具有显著的局部与整体的关系。


人工智能—我们与影视作品的距离还有多远 ?
人工智能—我们与影视作品的距离还有多远 ?


局部连接和权值共享,极大的减少了网络的参数,使得模型可以快速的收敛,并减小了对样本量的需求。


4、循环神经网络模型


在处理时间序列数据时,由于数据前后往往存在某种联系,这是就需要用循环神经网络(RNN)才能对数据更好的建模。


人工智能—我们与影视作品的距离还有多远 ?


循环神经网络也是一种共享权值的方式,只不过是在不同时间上权值共享。


03

深度学习的应用



1、语音处理


语音处理包括语音识别语音合成


深度学习最先在语音处理上取得突破性进展,Google、百度相继推出各自的语音识别系统;2016年,微软在日常对话数据上的误识率低至5.9%;


语音合成方面,Google DeepMind 推出 WaveNet 语音合成模型,百度推出产品级别的实时语音合成系统Deep Voice3。


2、计算机视觉


深度学习在计算机视觉方面的应用多种多样。


包括交通标志的检测与分类、人脸识别、人脸检测、图像分类、物体检测、图像语义分割、实时多人姿态估计、行人检测和场景识别等;


对抗网络之后的应用,如:黑白照片自动着色、风格转换、去掉图像中的马赛克和图像解读等;


另外,Google DeepMind 和牛津大学合作的唇语识别正确率达到93%,远超过人类的52%的正确率。


3、自然语言处理


自然语言识别是一个还在不断研究的领域。机器翻译、词性标注、情感分析方面已经比较成熟了;文字生成、对话系统代表性的有ELMo、GPT和BETR等。


4、其他方面


在生物学方面,深度学习用于预测药物分子的活动,DNA基因突变对疾病的影响等;


金融行业,深度学习用于金融市场预测、证券投资组合和保险风险预测等;


深度学习还用于电力系统,交通系统的优化。



总结:

或许,电影中拥有情感的机器人离我们的生活还有一段距离,并且拥有较大争议。但毫无疑问,人工智能不仅仅是科学领域的研究课题,也是消费电子市场关注的技术。在一定范围内的广泛应用,对于人们生活质量的提升应该是巨大的。



 本期到这,下期见!


【参考链接】

1.https://github.com/scutan90/DeepLearning-500-questions

2.https://arxiv.org/ftp/arxiv/papers/1804/1804.01653.pdf

3.https://my.oschina.net/u/876354/blog/1626639

4.https://www.cnblogs.com/robert-dlut/p/9824346.html



以上是关于人工智能—我们与影视作品的距离还有多远 ?的主要内容,如果未能解决你的问题,请参考以下文章

把人工智能习以为常,距离还有多远

工程师说|自动驾驶距离我们还有多远?

用代码构建机器心智,我们离这个目标还有多远?

「灯塔工厂」距离规模化复制还有多远?

辛东方:人工智能究竟离我们还有多远?

离人工智能进入我们的社会还有多远?(CES 2022 新品尝鲜)