sklearn 高斯朴素贝叶斯 - 为啥是“高斯”?

Posted

技术标签:

【中文标题】sklearn 高斯朴素贝叶斯 - 为啥是“高斯”?【英文标题】:sklearn Gaussian Naive Bayes - why "Gaussian"?sklearn 高斯朴素贝叶斯 - 为什么是“高斯”? 【发布时间】:2017-11-13 10:32:25 【问题描述】:

我了解贝叶斯定理,但不了解分类器中的“高斯”部分是什么。为什么叫“高斯”?

【问题讨论】:

我投票结束这个问题,因为它不是一个真正的编程问题。 【参考方案1】:

考虑sklearn.naive_bayes.GaussianNB 的设置。 fit 方法采用 xy,并尝试适应它们。它们对应随机变量Xy的实例,y取一些值c ∈ C。因此,我们可以估计 f(X|C = c)。当然,我们对 P(C = c|X) 感兴趣。如果你还记得贝叶斯定理,

P(A | B) = P(B | A)P(A) / P(B),

我们需要 X 的先验分布来进行这种反转。在gaussian naive bayes 中,这被假定为正态分布。

【讨论】:

值得补充的是,正态分布的另一个术语是高斯分布,因此得名。

以上是关于sklearn 高斯朴素贝叶斯 - 为啥是“高斯”?的主要内容,如果未能解决你的问题,请参考以下文章

使用sklearn进行高斯朴素贝叶斯分类的数据类型,如何清理数据[重复]

sklearn-朴素贝叶斯

机器学习:贝叶斯分类器——高斯朴素贝叶斯分类器代码实现

实战|朴素贝叶斯分类对文档进行分类

sklearn中的朴素贝叶斯模型及其应用

sklearn中的朴素贝叶斯模型及其应用