基于文字的人工智能哲学——现状困境思路与发展

Posted 2020-06-26

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了基于文字的人工智能哲学——现状困境思路与发展相关的知识，希望对你有一定的参考价值。

　　还记得电影《她》中所描绘的未来世界人工智能技术吗？任何人都可以通过自然语言与智能操作系统顺畅交流，她就像一个真实存在但没有实体的人一样。基于语言文字的交互技术确实是美好而诱人的，但是它同时也是个“holy grail”问题——美好但难以实现。

技术分享

　　人脑VS计算机，重新审视人类大脑

　　要让计算机像人一样能理解自然语言与文字，确实是个不小的难题。纵观眼下的人工智能技术，其智能的背后都是人工。然而人们对计算机的智能过于乐观，真实的计算机还远没有实现智能。人们对计算机的智能总是存在这样一个误区：计算机运算速度越来越快，存储量越来越大，所以计算机必然越来越“聪明”。然而真的是这样吗？计算机快过人类大脑？不一定。人类大脑本身就是一种独特的数据存储结构，这种结构有其纯天然的优势。虽然在处理简单计算时远远不如计算机，但是它在处理抽象问题时优势明显，例如：计算机能快速地计算一个数学表达式到值，但是它却不能像人一样去把一个问题处理成数学表达式，这足以表明计算机所谓的快在人脑面前是如此不堪一击。人的存储不如计算机？不一定，人脑对信息的存储是一种提取抽象信息的存储。比如，一张脸，人见到后就记住了，抽象出特征存储起来，当其再次看到这个人的时候，他能利用存储的抽象信息将其准确识别出来，大脑的存储是一种不同于计算机存储的抽象的模糊的存储。计算机虽然能存储一个人的所有图像，声音，但它却未必能识别出来，因为这种存储是这么的简单粗暴。两者这样一比较，存储性能高下立见。所以从表面上看人脑远不如计算机，而实际上人脑才是正真的智能机器。在客观的认识了计算机的人工智能之后，可以负责任的讲，目前我们的却可以让计算机尽可能地“正确地”回答问题，但绝对不是真的理解。过去现在都做不到，而且在将来很长的一段时间里都无法做到。

　　人工智能的中文房间哲学困境与泛智能泥潭

　　既然理解做不到，那么让我们来看看现在基于文字的人工智能技术都能做些什么？首先来看一下高大上的问答程序是如何实现的。现在能实现自然语言问答的程序，多是构建一个输入到输出的映射，程序接收自然语言后，提取关键词，然后数据库检索，返回相关度最高的一个。咋一看【自然语言——关键词——搜索结果】这模式和搜索引擎有些类似，传统的搜索引擎都是【关键词——搜索结果】模式，优化的都是这个对应过程，但是近年来各搜索巨头纷纷进军人工智能领域，重点开始转向做【自然语言——关键词】的优化，依托强大的计算能力和存储的海量数据，巨头们已经做出了比较智能的问答程序，对于一般的问答，程序都能“正确地”回答，甚至还能处理一些刁钻的调戏。那么问题来了，如果把问答程序看成黑盒，它就具有了响应自然语言的能力，但是这能否说它具有智能呢？美国哲学家John Searle于20世纪80年代初提出了一个类似的问题——中文房间问题，一个拥有万能中英文对照词典的英国人宅在一间房子里，当你在屋外和他交流时，会惊奇地发现这间房子能听懂中文。这个问题的提出最初是为了反驳图灵测试，然而它的意义却不仅仅限于此，中文房间引出的哲学困境已经是人工智能不得不面对的问题。目前的智能，就像中文房间所描述的那样，只是停留在“看起来很智能”，计算机也只是看起来能理解自然语言。

技术分享

　　然而另一些基于文字的人工智能比问答程序走的更远——语音助手，它除了具有问答程序的所有功能外，还能“听懂”打电话，发短信，排日程之类的自然语言。这些功能是不需要检索实现的，而是直接响应，貌似比问答程序看起来更智能了？比如：你对着cortana说“9乘以8等于多少？”，他会立马给出答案。其实这些诸如“给xx打电话”“上午xx点做xx”之类的自然语言都是高度标准化的，不同的模式直接套用对应的处理过程即可，另外还有一些封闭式问题：有没有，是不是？也是高度标准化的。如果你问一些开放性的抽象的问题，机器根本没办法处理，因为问题太抽象了，设计人员无法一一抽象出标准化的处理过程，这时就要求助于上面的问答程序了。了解了其中的原理，我们再看写稿机器人，就不会觉得神秘了。写稿机器人之所以能用来写新闻，只不过是因为人们把原始信息到新闻的过程提取出抽象模式，新闻的格式，要素等都是标准化的。只要把初始信息交给写稿机器人，机器人按照这个处理模式就写出了新闻。从上面的两个例子中可以看出这些智能程序都是设计出来解决某一特定问题的，那么为什么不设计出通用的智能程序（一种泛智能程序）解决所有问题呢？其实早在人工智能发展初期，人们就设计出了解决各种问题的专用智能程序，但是当人们向通用智能程序迈进时却发现，这个目标就像“开发永动机”一样荒谬。专用智能覆盖面小，但制作简单；通用智能（泛智能）覆盖面大，但制作难度也大。这显示了专用智能和通用智能之间的哲学矛盾。不过语音助手已经为我们提供了解决这个矛盾的一个样板，即专用智能配合一定的通用智能。

　　基于哲学的解决思路与语言的启发

　　上面我们分析了基于文字的人工智能的两个哲学困境：中文房间问题和泛智能泥潭。现在就让我们大胆假设一下，如果要让计算机实现真正的理解自然语言应该解决哪些问题。我认为最核心的就是语言学难题。语言不单单是一门技术，更是一门高深的哲学。这点可以从20世纪哲学的语言学转向就可以看出。在过去很长一段时间内哲学家关注的是世界的本源，人对世界的认识，但是自进入20世纪，哲学的研究就有了语言学转向。现在不仅是计算机科学家，全世界的哲学家都在努力破解语言的奥秘——为什么语言能表达万物？这个问题之所以和人工智能关系重大，是因为计算机本质上使用0和1表达世界的。比如1代表正确0代表错误，这就是现实世界中的一个描述。又比如计算机语言中的class可以描述现实世界中的类。所有0和1可表的问题都是计算机可处理的问题，问题是语言可表的东西0和1能否可表？如果可以该如何实现？或许我们能从语言中得到一些启发，我并不打算在此探讨这个深奥的哲学问题，只是想把这个问题提出来，以供大家思考？有时候提出一个问题的意义并不在于解决这个问题。01语言问题本身就陷入了泛智能的泥潭之中，我们不是真的希望寻求可表达整个世界的通用智能，而是在某种程度上达到一种平衡。在我看来，实现计算机理解自然语言所必须的三个能力是：

　　1，对世界的一个基本描述

　　2，对交流对象的一个基本描述

　　3，对计算机自我的一个基本描述

以上任何一个都是计算机难以实现的天方夜谭，我们目前还无法企及，只能从语言学中最基本的做起。例如语言既能够表达精确的信息，同时又具有模糊性和不确定性，如何处理语言的不确定性是一个问题，中国的李德毅院士提出了云模型来做不确定性概念定性与定量之间的转换，于是计算机能表达现实世界中的不确定性概念（大概，好像，大约等），这是一个很好的开始。

技术分享

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　如果01可表世界，那么我们为什么不是01，亦或是我们本身就是01而我们却浑然不知？

　　人工智能仍在发展......

　　虽然泛智能遥遥无期，但这并不影响我们享受人工智能的服务。在有限的时间里开发出专用的人工智能服务显然比在无限的时间里开发通用的人工智能要高明得多，只要我们能在某一方面使程序具有较为完善的智能，对于用户来讲，和泛智能是没有区别的。所以在今后很长一段时间里，基于文字的人工智能具有较高的商业价值，商业巨头们也会开发出回答越来越“流畅”的人工智能。另一方面我们对于语言的探索，还在起步阶段，要想在自然语言的理解上取得突破性进展，还需要大量的研究人员做基础性的研究工作，毕竟看起来“理解”并不等于真的理解。

以上是关于基于文字的人工智能哲学——现状困境思路与发展的主要内容，如果未能解决你的问题，请参考以下文章

科学世界的人文关怀：开源科学与人工智能

深度学习发展下的“摩尔困境”，人工智能又将如何破局？

High&NewTech：元宇宙(metaverse)的简介(多角度理解与探讨)发展历史现状与未来

人工智能的现状与未来

国内AR行业现状研究之百度的AR

人工智能的现状及今后发展趋势展望---周鑫