这个彩蛋表明,图灵测试评估的也许不是计算机,而是人类……

Posted turingbooks

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了这个彩蛋表明,图灵测试评估的也许不是计算机,而是人类……相关的知识,希望对你有一定的参考价值。

题图 | ARCHIVIO GBB/CONTRASTO/REDUX

我们知道,图灵对人脑和机器之间的联系非常着迷,在1936年发表可计算数论文之后,他对这个问题的痴迷仍延续了很久。1950年,他在哲学期刊Mind上发表了另一篇著名论文《计算机器和智能》(Computing Machinery and Intelligence)的论文,这篇论文的技术性不是很强,图灵在文中提出一个问题:机器能思考吗?

模仿游戏

他并未试图去定义“机器”和“思考”,而是略述了一种思想实验,该方法源自维多利亚时代的一种叫做“模仿游戏”的娱乐活动:房间里有一男一女,房间外有一个评判员。评判员可以提问题,房间内的人通过手写卡片来回答。评判员要猜测对方是男是女。难点在于,男人一直设法模仿女人来欺骗评判员,而女人则设法让评判员相信自己才是女人。

模仿游戏 | 图源:Doug Rose

图灵受此启发,发明了一个测试,这个测试需要一个人坐在电传打字机前。这个人问问题,接受答案。如果另一端是计算机,而这个人无法判断它是否是一台计算机,那么就说计算机是具备人类智能的。

图灵测试 | 图源:Diseño propio

这就是著名的图灵测试,它至今依旧存在争议。任何对图灵测试有适当反对意见的人都应该读一读图灵的这篇论文,里面有对很多合情合理的反对意见的解答。

图灵喜欢用术语“智能”而不是“思考”来处理这个问题,因为“思考”暗含在计算机内部进行的特定活动:

“机器能思考吗?”我认为,这个原始问题过于无意义,不值得讨论。不过,我认为到这个世纪末,这样的说法以及一般的教育观点都会有很大改观,那时候再谈及机器思考将不会受到抵触和反对。

上个世纪末已经过去了,若说有什么改观,那就是比以往任何时候都多的人知道了计算机能够干什么。但可以确定的是,计算机能干的事不是“思考”。我们还没到可以期待计算机媲美人类智能的地步。

图灵机和图灵测试是阿兰·图灵声明不朽的两大基石。有人认为,图灵机是以一种非常机械的方式展现人类如何进行数学运算的,而图灵测试则是对计算机能力的人为评估。但事实果真如此吗?

论文中的彩蛋

仔细阅读图灵的论文会发现一个小细节:测试中存在一处“歧义”,这也许表明图灵更多的是将图灵测试作为在哲学层面上对机器智能的挑衅,而不是作为一种实际测试。在论文中,图灵模拟了测试未来的智能计算机的场景(人类提问,计算机回答)。

问:请给我写一首关于福斯桥的十四行诗。

答:还是算了吧,我永远都不会写诗。

问:34957加70764等于多少?

答:(停顿约30秒后回答)105621。

问:你会下国际象棋吗?

答:会。

问:我在我的K1处有棋子K,除此之外再无其他。你在K6处有棋子K、R1处有棋子R。现在该你走了。你怎么走?

答:(停顿15秒后)把棋子R走到R8处,将军。

在这个测试中,计算机犯了一个数学上的错误。34957加70764实际上等于105721,而非105621。作为一位杰出的数学家,图灵应该不太可能犯下这种低级错误,他更有可能是将其作为送给敏锐读者的一个彩蛋。

图灵在论文的其他部分似乎有所暗示:计算错误是一种编程技巧,是欺骗评判员的手段。图灵很清楚,如果细心的读者发现了计算机的回答有误,那么他们就会认为自己是在跟人类对话。毕竟,计算机怎么会犯这种基本的运算错误呢?图灵写道:可以通过编程使机器“故意在计算上犯错,从而迷惑评判人员”。

虽然在1950年用“故意犯错”来暗示机器具有“人类智能”的想法或许难以理解,但如今的NLP程序员其实已经这么做了。

比如,2014年6月有报道称,一个叫做Eugene Goostman的聊天机器人成为首个通过图灵测试的计算机。但很快就有批评者指出,它之所以能通过测试,只是因为内置了作弊程序:Eugene模仿了一个以英语为第二语言的13岁小男孩,这就意味着它在文法和句法方面的错误,以及它的知识不完备,会被误认为是小孩的天真和不成熟,而不是自然语言处理能力上的缺陷。

再比如,2018年谷歌的语音助理Duplex因其能发出很像人类的“嗯”和“啊”声而艳惊四座。然而有很多人指出,这并非是系统真正思考之后的呈现,而是通过编程手段模拟的人类认知活动中的犹豫。

这两个案例都印证了图灵的想法:可以通过编程让计算机犯一些简单的错误,从而让人觉得它们是人。和图灵一样,Eugene和Duplex的程序员也很明白,让计算机在表面上展现出人类会犯的错误,就足以迷惑我们了。

也许图灵测试评估的并非机器是否具有智能,而是评估我们人类是否愿意接受机器是智能的。正如图灵本人所言:“对智能本身的判定是感性的,而非数学的。我们在多大程度上将某物的表现视为智能,取决于我们自己的心理状态和所受的教育,也取决于考察对象的特性。”

图灵似乎是在暗示我们,或许智能不是一种可以通过编程让机器获得的东西,而是一种通过社会互动构建的特质。

对此,你怎么看?

References

[1]https://spectrum.ieee.org/untold-history-of-ai-why-alan-turing-wanted-ai-to-make-mistakes

[2]《图灵的秘密:他的生平、思想及论文解读》

编译:刘文元

以上是关于这个彩蛋表明,图灵测试评估的也许不是计算机,而是人类……的主要内容,如果未能解决你的问题,请参考以下文章

怎么成为java高级架构师?图灵学院总结的java架构师学习路线

软件测试如何有效的评估你的代码质量

大数据&AI人工智能图灵:计算机器与智能 - 经典AI论文系列

大数据&AI人工智能图灵:计算机器与智能 - 经典AI论文系列

Luogu[SDOI2008]Sue的小球

BZOJ2037: [Sdoi2008]Sue的小球