朴素贝叶斯分类器伯努利模型

Posted

技术标签:

【中文标题】朴素贝叶斯分类器伯努利模型【英文标题】:Naïve Bayes Classifier Bernoulli model 【发布时间】:2016-02-14 07:14:10 【问题描述】:

我正在对发票和收据进行分类,我将使用伯努利模型。

这是朴素贝叶斯分类器:

P(c|x) = P(x|c) x P(c) / P(x)

我知道如何计算 P(c) 类先验概率,因为我们假设所有单词都是独立的,所以我们不需要 P(x)。

现在的公式是这样的:P(c|x) = P(x|c) x P(c) 为了计算 P(x|c),我们使用似然法计算所有单词的概率 P (c|X) = P(x1|c)P(x2|c)*P(x3|c)....

我的问题是在计算似然性之后,我是否需要将它与 P(c) 相乘,P(c|X) = P(x1|c)P(x2|c)*P(x3|c) ...*个人电脑)?

【问题讨论】:

【参考方案1】:

P(c|x) 等于P(x|c) P(c)。它是成比例的,就像你在分类过程中所做的那样

cl(x) = arg max_c P(c|x) = arg max_c P(x|c) P(c) / P(x) = arg max_c P(x|c) P(c)

这适用于每个概率分布,其中P(x)>0,此时不需要任何贝叶斯假设。这只是一个简单的贝叶斯定理 + 注意到 P(x) 只是这个等式中的一个正常数。

因此,您从不实际计算P(c|x),您只需计算P(x|c) P(c),这将为您提供相同的分类。我希望这表明您的分类必须基于P(x|c)P(c) 的乘积,正如您所指出的P(x|c) = PROD_i P(x_i|c)(这里我们使用朴素贝叶斯关于独立性的假设,而不是之前) .

【讨论】:

以上是关于朴素贝叶斯分类器伯努利模型的主要内容,如果未能解决你的问题,请参考以下文章

分类-朴素贝叶斯(高斯多项式伯努利)

朴素贝叶斯分类器(伯努利贝叶斯+高斯贝叶斯+多项式贝叶斯)

机器学习-朴素贝叶斯(高斯多项式伯努利)

当预测变量不是二进制时,Sklearn 朴素贝叶斯伯努利分类器如何工作?

贝叶斯方法—高斯,多项式,伯努利朴素贝叶斯分类

机器学习:朴素贝叶斯分类器实现二分类(伯努利型) 代码+项目实战