人工智能—我们与影视作品的距离还有多远 ?

Posted 2021-04-26 一办综合办公室

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了人工智能—我们与影视作品的距离还有多远 ?相关的知识，希望对你有一定的参考价值。

说到人工智能，让我想起2001年史蒂文·斯皮尔伯格执导的电影《人工智能》。

电影中小男孩大卫是第一个被输入情感程序的机器男孩。大卫被设定为一生只爱领养了他的“妈妈”莫妮卡。在莫妮卡的儿子苏醒之后回到家中发生的一系列事情，导致了莫妮卡对大卫产生误会，最终被莫妮卡抛弃。为了重回莫妮卡的身边，变成真正的小孩，大卫走上了寻找自己人生价值的路程。

人工智能从诞生到现在已经有70年的历史了，中间几经波折，神经网络算法的一次次突破总是带给人工智能一次次进步。

人工智能的历史

人工智能的概念最初是由图灵提出的。

图灵提出：如果一台机器能够与人类对话而不被辨别出机器的身份，那么这台机器就具有了智能的特性。

AI诞生

1956年，以明斯基和麦卡锡为代表的来自不同学科的科学家，在美国达特茅斯学院的一次会议上正式确立了人工智能的研究学科。

第一次发展高潮（1955年—1974年）

达特茅斯会议之后是人工智能的大发展时期，也是人工智能的第一次高潮。这一时期，提出了第一款神经网络模型和启发式学习算法。

第一次寒冬（1974年—1980年）

到了70年代，AI的研究遇到瓶颈，加之由于前期人们对AI的期望过高，导致后期不满情绪增加。许多机构开始不断减少对人工智能研究的资助，直至停止资助。

第二次发展高潮（1980年—1987年）

80年代初，由于一类名为“专家系统”的AI程序开始为世界上的公司所采纳，人工智能迎来了第二次发展高潮。这一时期BP算法也被提出，实现了神经网络训练的突破，神经网络的研究也受到广泛关注。

第二次寒冬（1987年—1993年）

1987年，由于AI硬件的需求下降，人工智能经历了第二次的寒冬。专家系统虽然好用，但是应用领域狭窄，更新和维护成本也很高。

第三次发展高潮（1993年至今）

90年代后，在摩尔定律下，计算机性能不断提升，云计算、大数据、机器学习、自然语言处理和机器视觉等领域的发展，人工智能迎来了第三次高潮。

2006年，Geoffrey Hinton 提出深度信念网络用于在深度神经网络的训练。

2016年-2017年，“Alpha Go”在围棋比赛中，战胜人类围棋高手“李世石”和“柯洁”，人工智能进入爆发时期。我国也将人工智能纳入国家发展战略之中。

最近上线的史上最大人工智能模型GPT-3，模型拥有1750亿个参数，占用300G存储，由45TB数据训练而成，虽然相比于一个成年人类100TB的脑容量还有一定差距，但它已经可以陪你聊词品曲畅谈人生哲理了。甚至还可以编程、画表、写文、做数学题。与2月份刚刚上线的全球最大网络模型Turing NLP相比还要大上10倍。

如此之快的迭代速度，未来人工智能的发展可想而知。很多专家学者也对此次浪潮给予肯定，认为此次人工智能的浪潮很可能引起第四次的工业革命。人工智能也将引起教育医疗，交通娱乐，保险金融等众多行业的变革。

2018年，在中国人工智能行业创新Top100排行榜中，华大基因超过科大讯飞，位列第四。作为全球最大的基因组学研究机构之一的华大基因，也已在人工智能领域早早布局，像SNP检测、抗原/抗体检测、蛋白质结构预测和单分子测序等，都是人工智能在生物领域的应用。未来基因大数据的破解带来的不仅是价值千亿、万亿的产业，也将会对深刻影响人们思想、观念以及对自身的认识。希望到时我们都可以享受人工智能带来的科技福利，而不只是少数人的特权。

那么，什么是人工智能？引起这次人工智能浪潮的深度学习算法又是什么呢？

什么是人工智能

定义

人工智能是研究、开发用于模拟延伸人智能的理论、方法和技术，它企图理解人类智能的实质，制造出能以人类相似方式做出反应的智能机器；

它涉及机器人、语言识别、图像识别、自然语言识别和专家系统等领域；

它是对人的意识、思维过程的模拟，它不是人的智能，但是能像人一样思考，还可能会超过人类的智能。

分类

弱人工智能：指专攻某一领域的人工智能，像Siri，围棋比赛中的AlphaGo；

通用人工智能：指具有一般人类智能水平，能解决人类能解决的任何智力问题的智能机器；

超人工智能：在几乎所有领域，比最优秀的人类大脑还要聪明。

三大学派

符号学派：模拟人的心智，认为人工智能源于数理逻辑，通过计算机可以研究人的思维过程，模拟人类的智能活动，代表人物有西蒙（Simon）；

联结学派：模拟脑的结构，认为人工智能起源于仿生学，是对人脑模型的研究，代表人物明斯基（Minsky ）；

行为学派：模仿人的行为，认为人工智能源于控制论，通过把神经系统的工作原理与信息理论、控制理论等联系起来，来实现自寻优、自适应、自组织和自学习的系统，代表人物有维纳（Wiener）；

人工智能之深度学习

深度学习是机器学习领域中一个新的研究方向，它被引入机器学习使其更接近于最初的目标——人工智能。

深度学习是一类模式分析方法的统称。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。

深度学习的发展

1943年，生理学家McCulloch和数理逻辑学家Pitts 创立了神经元的数学模型，即MP模型。

1958年，Rosenblatt 提出了第一代的神经网络单层感知器，能够区分三角形、正方形等基本形状，但单层感知器的神经网络连逻辑中简单的异或问题都不能解决，神经网络也随着人工智能消沉一段时间。

1986年，Hinton等提出第二代神经网络，将之前单一固定的特征层替换为多个隐含层，采用Sigmoid激活函数，通过反向传播算法，有效的解决了非线性分类问题，Cybenko和Hornik等也在1989年证明了：任何函数都可以用一个单隐层的神经网络以任意精度逼近。

同年，LeCun等发明了卷积网络算法用于手写字的识别。卷积神经网络是一种处理局部和整体相关性的网络结构，通常被应用于图像识别、自然语言识别以及语音识别领域，因为图像数据具有显著的局部与整体的关系。

1991年，由于反向传播算法被指出存在梯度消失的问题。此后十多年，神经网络局限于浅层网络的研究，支持向量机等浅层网络被用于各种现实问题应用中，而深层网络的研究被搁置。

2006年，Hinton等探讨大脑的图模型，提出了深度信念网络用于预训练深度网络的，来解决深度网络梯度消失的问题。

2010年，美国国防部计划首次资助深度学习项目。

2011年，Glorot 等提出ReLU 激活函数，有效的抑制了梯度消失的问题。深度学习首先在语音识别和图像识别领域取得重大突破。2011年，微软和谷歌先后采用深度学习将语音识别错误率降低至20%-30%。

2012年，Hinton和它的学生将ImageNet 图片分类的错误率从26%降低至15%。此后，深度学习进入爆发期。

后来，Dauphindeng 等，CHoromanska等分别在2014年、2015年独立证明了局部极小值问题通常不是严重的问题，消除了笼罩在神经网络上的阴霾。

深度学习的典型模型

1、人工神经网络模型

多层感知器中的特征神经元模型称为感知机，简单的单感知机分类器如下所示：

x1，x2，x3为输入，w1，w2，w3为权重，f为激活函数，当输入的加权和通过激活函数的值大于某一阈值时，输出为正，否则为负，由简单的感知机可以构成复杂的多层感知器。

神经网络的训练通过后向传播算法（BP）来实现。

2、深度信任网络模型

深度信念网络（DBN）是2006年 Hintion 为了解决深度网络模型难以训练的问题提出的。一个DBN 模型由若干个RBM 构成，训练时由低到高逐层进行预训练提取特征。

深度信念网络（DBN）是一种无监督的逐层预训练的方法，可应用在很多方面，像自编码网络、去噪网络和稀疏核机等。

3、卷积神经网络模型

卷积神经网络是一种处理局部和整体相关性的网络结构，通常被应用于图像识别、自然语言识别以及语音识别领域，因为图像数据具有显著的局部与整体的关系。

局部连接和权值共享，极大的减少了网络的参数，使得模型可以快速的收敛，并减小了对样本量的需求。

4、循环神经网络模型

在处理时间序列数据时，由于数据前后往往存在某种联系，这是就需要用循环神经网络（RNN）才能对数据更好的建模。

循环神经网络也是一种共享权值的方式，只不过是在不同时间上权值共享。

深度学习的应用

1、语音处理

语音处理包括语音识别和语音合成。

深度学习最先在语音处理上取得突破性进展，Google、百度相继推出各自的语音识别系统；2016年，微软在日常对话数据上的误识率低至5.9%；

语音合成方面，Google DeepMind 推出 WaveNet 语音合成模型，百度推出产品级别的实时语音合成系统Deep Voice3。

2、计算机视觉

深度学习在计算机视觉方面的应用多种多样。

包括交通标志的检测与分类、人脸识别、人脸检测、图像分类、物体检测、图像语义分割、实时多人姿态估计、行人检测和场景识别等；

对抗网络之后的应用，如：黑白照片自动着色、风格转换、去掉图像中的马赛克和图像解读等；

另外，Google DeepMind 和牛津大学合作的唇语识别正确率达到93%，远超过人类的52%的正确率。

3、自然语言处理

自然语言识别是一个还在不断研究的领域。机器翻译、词性标注、情感分析方面已经比较成熟了；文字生成、对话系统代表性的有ELMo、GPT和BETR等。

4、其他方面

在生物学方面，深度学习用于预测药物分子的活动，DNA基因突变对疾病的影响等；

金融行业，深度学习用于金融市场预测、证券投资组合和保险风险预测等；

深度学习还用于电力系统，交通系统的优化。

总结：

或许，电影中拥有情感的机器人离我们的生活还有一段距离，并且拥有较大争议。但毫无疑问，人工智能不仅仅是科学领域的研究课题，也是消费电子市场关注的技术。在一定范围内的广泛应用，对于人们生活质量的提升应该是巨大的。

本期到这，下期见！

【参考链接】

1.https://github.com/scutan90/DeepLearning-500-questions

2.https://arxiv.org/ftp/arxiv/papers/1804/1804.01653.pdf

3.https://my.oschina.net/u/876354/blog/1626639

4.https://www.cnblogs.com/robert-dlut/p/9824346.html

以上是关于人工智能—我们与影视作品的距离还有多远 ?的主要内容，如果未能解决你的问题，请参考以下文章

把人工智能习以为常，距离还有多远

工程师说｜自动驾驶距离我们还有多远？

用代码构建机器心智，我们离这个目标还有多远？

「灯塔工厂」距离规模化复制还有多远？

辛东方：人工智能究竟离我们还有多远？

离人工智能进入我们的社会还有多远？(CES 2022 新品尝鲜)