计算朴素贝叶斯分类中的概率

Posted

技术标签:

【中文标题】计算朴素贝叶斯分类中的概率【英文标题】:Calculating Probabilities in Naive Bayes Classification 【发布时间】:2015-10-09 15:59:11 【问题描述】:

我有一个包含分类属性和连续属性的数据集。我想应用朴素贝叶斯分类方法对数据进行分类。

如何计算这两种类型的概率?

我应该使用计数方法来计算分类数据并假设一些分布并从连续数据上计算?

【问题讨论】:

【参考方案1】:

由于朴素贝叶斯假设每个特征观测独立于你拥有的类标签

P(cat1, con1|y) =  P(cat1|y)P(con1|y)

其中cat1 是一些分类变量,con1 是连续的,您可以完全独立地对这些概率中的每一个进行建模。正如您所建议的那样,对于分类您可以使用简单的经验估计器(但是请记住一些平滑技术,因此您不会得到 0 概率),对于连续您需要一些更复杂的估计器(例如使用固定分布族的 MLE - 例如高斯;或更复杂的东西 - 作为任何概率分类器/模型)

【讨论】:

以上是关于计算朴素贝叶斯分类中的概率的主要内容,如果未能解决你的问题,请参考以下文章

贝叶斯分类

机器学习——朴素贝叶斯算法

朴素贝叶斯模型——文本情感分类

朴素贝叶斯分类——大道至简

朴素贝叶斯分类原理

朴素贝叶斯分类器原理