Science论文：诺奖经济学家的经典决策模型，被AI挑战

Posted 2021-08-17 AI科技大本营

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Science论文：诺奖经济学家的经典决策模型，被AI挑战相关的知识，希望对你有一定的参考价值。

在2019年DOTA2的顶级赛事TI8的正赛完成之后，OpenAI的人工智能战队与TI8的冠军OG举行了一场表演赛，在英雄阵容限定17个，部分道具和功能禁用的前提下，OpenAI以2：0完胜了OG，尤其值得一提的是第二场比赛仅用时15分钟OpenAI就把OG斩落马下，这一系列的精彩表现也让OpenAI在业界抱得大名。

摆在你面前的是这两个选项：20% 概率得到 100 美元，80% 的概率得到 50 美元。你会选择那个？

在经济学领域，这个问题与一个著名的理论息息相关。那便是诺贝尔经济学奖获得者卡尼曼在 1979 年提出的前景理论（Prospect Theory）。

这个理论指出，在权衡 “获得” 的时候，人们普遍希望更有把握的选择，而不想有风险。即面临获得时往往小心翼翼、规避风险；面对失去时反而因为不甘心而更容易冒险。这揭示了，人在损失时的痛苦感与获得时的快乐感并不对等，前者的程度更强烈。

尽管前景理论隶属于经济学范畴，另一方面，这个理论也反映了智能体在决策认知上存在的误区。

决策是很重要的，因为它最终决定了某些生活和社会结果，并且是相当多的经济行为的基础。但实际情况是，人类做出决定的过程有时既复杂又看似随意。

这也导致了大量理论和决策模型的出现，其中的不少理论，要不相互矛盾，要不就是新颖性不足、难以和其他理论相区分。更致命的是，大多数这些理论在现实世界中都不是很有用，很少有想法能对人类行为提供充分的见解，每个理论往往只能从不断增加的清单中解释少数现象。因此，即便虽然前景理论为人是如何进行决策提供了一种方法论，但用这个理论来模拟选择行为并非没有缺点。

而在普林斯顿大学的研究人员 Joshua Peterson 看来，造成这种情况的原因并不是缺乏独创性，而是该领域已经形成了这样的一个传统：新进展取决于理论和实验之间的迭代循环，但一个理论家能够投入的时间毕竟有限，加上该领域缺乏像其他科学中出现的新工具，使得理论发展的速度很难在过去几十年得到实质上的突破。

我们能加快这一进程吗？

Joshua Peterson 选中了一个新的工具，你不会陌生，它就是深度神经网络。正如 “数据实战派” 所多次报道过，深度神经网络已经对自然科学产生了很大的影响，但在行为科学上的作用却不如前者那么大，而 Joshua Peterson 所在的团队发表于 Science 的研究，便论证了机器学习为行为科学领域带来新的可能性。论文题为 Machine-generated theories of human decision-making。

首先，他们通过亚马逊的 Mechanical Turk 众包服务，开发了一个大型的风险决策数据集，收集了人类对近 10000 个风险选择问题的决定（例如文章开头的 “20% 的机会获得 100 美元，80% 的机会获得 50 美元” 这样的问题），用于测试和开发围绕人类风险决策的新理论。

据了解，这也是迄今为止最大规模的风险选择实验产物。由于依赖大量初始假设，先前在制定决策理论方面的努力通常涉及使用非常小的数据集，每次只关注少数几个选择问题。过去，利用现代数据驱动技术发现和评估人类判断的新模型也时有出现，但它们往往受限于小数据集，因而无法真正发挥其解释行为的能力。

然后，他们利用这个数据集来训练了一个深度神经网络，用以来预测人类行为，并系统地比较了这大模型与此前的小模型（如前景理论）对风险决策行为的预测能力。

结果发现，由这个数据集驱动的深度神经网络可以模仿人类的决定，其准确度令人惊讶，已大大超过了现有的、由人类产生的风险选择模型，深度神经网络的预测能力比前景理论高出几个能级（当模型在特定场景下预测出的选择，和人类的预测重合 50% 以上，则该模型能够预测该场景）。

在他们的实验中，这个神经网络胜过了所提出的 50 多种风险决策理论，这表明目前的理论仍存在着差距。

基于神经网络的模型，以及传统模型对风险决策预测误差的对比

但是，这个模型所产生的理论见解是什么？

风险决策本身已经是经典决策理论中最基本和最广泛研究的问题之一。Reichman 指出，风险决策模型本来就只是人们在日常生活中经常做出的决定的巨大复杂性的一个抽象。

为了分析这一点，他们将传统的风险选择理论按照层次结构进行分类，然后不依靠具体的理论，训练神经网络来寻找最佳预期效用理论模型、最佳前景理论模型等。即判断每一类理论的预测性如何，在它们之间进行比较，便可以确定哪些理论是具有先锋性的。

总之，论文作者相信，使用大型数据集加上机器学习算法，为发现新的认知和行为现象提供了巨大的潜力，如果没有这些工具，这些现象甚至将很难识别。

" 我认为我们的研究提供了一个真正令人兴奋的新例子，说明行为科学有望在未来加速发展。” 这种方法有可能在发现和完善决策理论方面帮助节省几年、甚至几十年的时间。

References：

1、Joshua C. Peterson et al, Using large-scale experiments and machine learning to discover theories of human decision-making, Science (2021). DOI: 10.1126/science.abe2629/

2、Sudeep Bhatia et al, Machine-generated theories of human decision-making, Science (2021). DOI: 10.1126/science.abi7668

更多精彩推荐
深度学习三巨头共同发文，聊聊深度学习的过去、现在与未来

二维已经 OUT 了？3DPose 实现三维人体姿态识别真香 | 代码干货

GitHub 遭抵制！AI 代码生成神器竟成“抄袭工具”？

以上是关于Science论文：诺奖经济学家的经典决策模型，被AI挑战的主要内容，如果未能解决你的问题，请参考以下文章