朴素贝叶斯法

Posted AI读书会

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了朴素贝叶斯法相关的知识,希望对你有一定的参考价值。

1.朴素贝叶斯

朴素贝叶斯法(naiveBayes)是基于贝叶斯定理和特征条件独立假设分类方法。对于给定训练集,首先基于特征条件独立性的假设,学习输入/输出联合概率(计算出先验概率和条件概率,然后求出联合概率)。然后基于此模型,给定输入x,利用贝叶斯概率定理求出最大的后验概率作为输出y。朴素贝叶斯法实现简单,学习和预测效率都很高,是一种常用的分类方法。

2.朴素贝叶斯推导过程

对于样本集:

其中m表示有m个样本,n表示有n个特征。yi,i=1,2,..,m表示样本类别,取值为{C1,C2,...,CK}

条件概率为(依据条件独立假设):

朴素贝叶斯法

后验概率为:

                    朴素贝叶斯法

将条件概率公式带入得:

朴素贝叶斯法

上式为朴素贝叶斯分类的基本公式。于是,朴素贝叶斯分类器可表示为:

                   朴素贝叶斯法

由于分母对所有的Ck都是相同的,所以:       

                  朴素贝叶斯法

3.朴素贝叶斯法的参数估计

3.1极大似然估计

针对样本集我们可以利用极大似然估计计算出先验概率:

                朴素贝叶斯法

其中mi=1I(yi=Ck)计算的是样本类别为Ck的总数。先验概率计算的是类别Ck在样本集中的频率。

                朴素贝叶斯法

其中第j个特征的取值可能是{aj1,aj2,...,ajh},共h个。该条件概率指的是,在样本类别为Ck的子样本集中,第j个特征取值为ajl的样本的频率。

 

3.2贝叶斯估计

为了弥补极大似然估计中可能出现概率值为0的情况(也就是某个事件出现的次数为0)。于是使用贝叶斯估计,如下:

              朴素贝叶斯法

其中K为类别的个数。

              朴素贝叶斯法

其中Sj为特征Xj取值的个数h

3.2朴素贝叶斯算法

1)计算先验概率和条件概率

2)对于给定的实例x=(x(1),x(2),…x(n)),计算:

              

3)确定实例x的类:

             

参考资料

[1] https://www.cnblogs.com/lliuye/p/9178090.html


以上是关于朴素贝叶斯法的主要内容,如果未能解决你的问题,请参考以下文章

朴素贝叶斯法

4.朴素贝叶斯法

朴素贝叶斯法

4.朴素贝叶斯法

Naive Bayes朴素贝叶斯法

机器学习笔记四 朴素贝叶斯法