透过现象看机器学习:奥卡姆剃刀,没有免费的午餐,丑小鸭定理等

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了透过现象看机器学习:奥卡姆剃刀,没有免费的午餐,丑小鸭定理等相关的知识,希望对你有一定的参考价值。

 Datawhale 

作者:邱锡鹏,复旦大学教授

寄语:本文对PAC学习理论、没有免费的午餐定理、丑小鸭定理、奥卡姆剃刀原理等机器学习中有名的理论或定理进行了详细的梳理。



在机器学习中,有一些非常有名的理论或定理,这些理论不仅有助于我们从本质理解机器学习特性,更好地学习相关理论,更重要的是可以有助于我们理解很多生活哲学,比如奥卡姆剃刀原理所延伸的极简主义:如无必要,勿增实体的理念,让我们一起细品吧。


没有免费午餐定理

没有免费午餐定理(NFL)是由Wolpert 和Macerday在最优化理论中提出的。没有免费午餐定理证明:对于基于迭代的最优化算法,不存在某种算法对所有问题(有限的搜索空间内)都有效。


如果一个算法对某些问题有效,那么它一定在另外一些问题上比纯随机搜索算法更差。也就是说,不能脱离具体问题来谈论算法的优劣,任何算法都有局限性. 必须要“具体问题具体分析”。



没有免费午餐定理对于机器学习算法也同样适用。不存在一种机器学习算法适合于任何领域或任务。型,那么他肯定是在吹牛。


透过现象看机器学习:奥卡姆剃刀,没有免费的午餐,丑小鸭定理等_机器学习


丑小鸭定理

丑小鸭定理(Ugly Duckling Theorem)是1969 年由渡边慧提出的[Watanable,1969]。“丑小鸭与白天鹅之间的区别和两只白天鹅之间的区别一样大”。这个定理初看好像不符合常识,但是仔细思考后是非常有道理的。


因为世界上不存在相似性的客观标准,一切相似性的标准都是主观的。


如果从体型大小或外貌的角度来看,丑小鸭和白天鹅的区别大于两只白天鹅的区别;但是如果从基因的角度来看,丑小鸭与它父母的差别要小于它父母和其他白天鹅之间的差别。

透过现象看机器学习:奥卡姆剃刀,没有免费的午餐,丑小鸭定理等_泛化_02

奥卡姆剃刀原理

奥卡姆剃刀原理是由14 世纪逻辑学家William of Occam提出的一个解决问题的法则:“如无必要,勿增实体“。

透过现象看机器学习:奥卡姆剃刀,没有免费的午餐,丑小鸭定理等_机器学习_03


奥卡姆剃刀的思想和机器学习上正则化思想十分类似:简单的模型泛化能力更好。如果有两个性能相近的模型,我们应该选择更简单的模型。


因此,在机器学习的学习准则上,我们经常会引入参数正则化来限制模型能力,避免过拟合。

透过现象看机器学习:奥卡姆剃刀,没有免费的午餐,丑小鸭定理等_泛化_04 奥卡姆剃刀的一种形式化是最小描述长度(Minimum Description Length,MDL)原则,即对一个数据集

以上是关于透过现象看机器学习:奥卡姆剃刀,没有免费的午餐,丑小鸭定理等的主要内容,如果未能解决你的问题,请参考以下文章

奥卡姆剃刀是什么?机器学习实践中那些学习模型或者那些评估指标践行了这一理论?

奥卡姆剃刀-简单有效原理的思维模型

机器学习入门-贝叶斯垃圾邮件过滤(原理)

机器学习中的没有免费的午餐定律是什么?“没有免费的午餐”对你意味着什么?没有免费午餐定律定律能给数据科学家提供什么启示?

什么是“奥卡姆剃刀原理”?

机器学习入门(4~9)