sklearn 高斯朴素贝叶斯 - 为啥是“高斯”?
Posted
技术标签:
【中文标题】sklearn 高斯朴素贝叶斯 - 为啥是“高斯”?【英文标题】:sklearn Gaussian Naive Bayes - why "Gaussian"?sklearn 高斯朴素贝叶斯 - 为什么是“高斯”? 【发布时间】:2017-11-13 10:32:25 【问题描述】:我了解贝叶斯定理,但不了解分类器中的“高斯”部分是什么。为什么叫“高斯”?
【问题讨论】:
我投票结束这个问题,因为它不是一个真正的编程问题。 【参考方案1】:考虑sklearn.naive_bayes.GaussianNB
的设置。 fit
方法采用 x
和 y
,并尝试适应它们。它们对应随机变量X和y的实例,y取一些值c ∈ C。因此,我们可以估计 f(X|C = c)。当然,我们对 P(C = c|X) 感兴趣。如果你还记得贝叶斯定理,
P(A | B) = P(B | A)P(A) / P(B),
我们需要 X 的先验分布来进行这种反转。在gaussian naive bayes 中,这被假定为正态分布。
【讨论】:
值得补充的是,正态分布的另一个术语是高斯分布,因此得名。以上是关于sklearn 高斯朴素贝叶斯 - 为啥是“高斯”?的主要内容,如果未能解决你的问题,请参考以下文章