朴素贝叶斯分类器是不好的估计器

Posted

技术标签:

【中文标题】朴素贝叶斯分类器是不好的估计器【英文标题】:Naive bayes classifiers are bad estimators 【发布时间】:2021-09-05 20:31:17 【问题描述】:

我在 Scikit-learn 指南 (https://scikit-learn.org/stable/modules/naive_bayes.html) 中读到了这个:

[...] 虽然朴素贝叶斯被认为是一个不错的分类器, 已知它是一个错误的估计量,因此概率输出 来自 predict_proba 的不要太认真'

既坏又体面?

【问题讨论】:

【参考方案1】:

好的,让我们提供一些上下文,引用2nd edition of Francois Chollet's book on Deep Learning 中的一段话,我相信这会阐明你的审讯。关键是朴素贝叶斯是第一个所谓的机器学习分类器之一,它假设输入数据中的特征都是独立的(朴素假设),仍然提供“下降”结果;但是,与最近的神经网络相比,分类任务的性能通常要低得多。

朴素贝叶斯是一种机器学习分类器,它基于应用贝叶斯定理,同时假设输入数据中的特征都是独立的(强或“朴素”的假设,这就是名称的来源)。这种形式的数据分析早于计算机,并且在其首次计算机实施(很可能可以追溯到 1950 年代)之前的几十年就被手工应用了。贝叶斯定理和统计学的基础可以追溯到 18 世纪,而这些都是您开始使用朴素贝叶斯分类器所需要的一切。

一个密切相关的模型是逻辑回归(简称logreg), 这有时被认为是现代的“你好世界” 机器学习。不要被它的名字误导——logreg 是一个 分类算法而不是回归算法。很像 朴素贝叶斯,logreg 早于计算很长一段时间,但它仍然是 由于其简单而多才多艺的性质,它至今仍然有用。它的 通常,数据科学家首先会尝试在数据集上获得 感受手头的分类任务。

【讨论】:

以上是关于朴素贝叶斯分类器是不好的估计器的主要内容,如果未能解决你的问题,请参考以下文章

贝叶斯分类器(3)朴素贝叶斯分类器

《机器学习》-- 第七章 朴素贝叶斯

机器学习系列-朴素贝叶斯分类器

用Java编写的开源朴素贝叶斯分类器[关闭]

19贝叶斯分类器:半朴素贝叶斯分类器(属性之间存在依赖)

动态朴素贝叶斯分类器和朴素贝叶斯分类器有啥区别