朴素贝叶斯分类器伯努利模型
Posted
技术标签:
【中文标题】朴素贝叶斯分类器伯努利模型【英文标题】:Naïve Bayes Classifier Bernoulli model 【发布时间】:2016-02-14 07:14:10 【问题描述】:我正在对发票和收据进行分类,我将使用伯努利模型。
这是朴素贝叶斯分类器:
P(c|x) = P(x|c) x P(c) / P(x)
我知道如何计算 P(c) 类先验概率,因为我们假设所有单词都是独立的,所以我们不需要 P(x)。
现在的公式是这样的:P(c|x) = P(x|c) x P(c) 为了计算 P(x|c),我们使用似然法计算所有单词的概率 P (c|X) = P(x1|c)P(x2|c)*P(x3|c)....
我的问题是在计算似然性之后,我是否需要将它与 P(c) 相乘,P(c|X) = P(x1|c)P(x2|c)*P(x3|c) ...*个人电脑)?
【问题讨论】:
【参考方案1】:P(c|x)
不等于P(x|c) P(c)
。它是成比例的,就像你在分类过程中所做的那样
cl(x) = arg max_c P(c|x) = arg max_c P(x|c) P(c) / P(x) = arg max_c P(x|c) P(c)
这适用于每个概率分布,其中P(x)>0
,此时不需要任何贝叶斯假设。这只是一个简单的贝叶斯定理 + 注意到 P(x)
只是这个等式中的一个正常数。
因此,您从不实际计算P(c|x)
,您只需计算P(x|c) P(c)
,这将为您提供相同的分类。我希望这表明您的分类必须基于P(x|c)
和P(c)
的乘积,正如您所指出的P(x|c) = PROD_i P(x_i|c)
(这里我们使用朴素贝叶斯关于独立性的假设,而不是之前) .
【讨论】:
以上是关于朴素贝叶斯分类器伯努利模型的主要内容,如果未能解决你的问题,请参考以下文章