朴素贝叶斯

Posted haosu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了朴素贝叶斯相关的知识,希望对你有一定的参考价值。

  为什么朴素贝叶斯如此朴素?主要由于它假定所有的特征在所有的数据集上是同等重要和独立的。这个假设在现实世界中是不真实的,所以说朴素。朴素贝叶斯(naive bayes),简单的假设特征条件独立,现实中独立的东西是不存在的,但是相关性较小的事物比较多的,于是贝叶斯往往能取得很好的效果。下面看下朴素贝叶斯的内容。

 

一、朴素贝叶斯的基本原理

  朴素贝叶斯通过对训练集数据集学习联合概率分布P(x,Y)。

  先验概率分布:P(Y=ck),k=1,2... 先验概率可以通过训练实例进行计算

  条件概率分布:P(X=x|Y=c)=P(x1,x2, ...xn|Y=ck) 这概率公式比较难计算,参数指数级。

  由于朴素贝叶斯假设条件,X互相独立同分布故:

    P(X=x|Y=ck) = P(X(1)=x1|Y=ck)..P(X(n)=xn|Y=ck) = ∏ P(X(i)|Y=ck)              (1)

 

  所以我们需要求解的目标:

               技术图片           (2)

     把(1)式代入(2)中可得朴素贝叶斯的基本公式:

            技术图片

      朴素贝叶斯的分类器也可以表示为:

           y=f(x) = arg max(P(Y=ck|X=x)

 

二、贝叶斯分类器的推导

  看到贝叶斯分类器的写法,感觉道理很简单,但具体怎么得来的还是有点不清晰,下面看下具体由来。

朴素贝叶斯后验概率最大化,这等价于期望风险最小化。选择合页损失函数:

 技术图片    

式中的分f(x)是分类函数,。期望风险可以表示为:

技术图片

 

以上是关于朴素贝叶斯的主要内容,如果未能解决你的问题,请参考以下文章

三种常用的朴素贝叶斯实现算法——高斯朴素贝叶斯伯努利朴素贝叶斯多项式朴素贝叶斯

数据挖掘十大经典算法之朴素贝叶斯

贝叶斯分类器(3)朴素贝叶斯分类器

朴素贝叶斯-商品评论情感分析

朴素贝叶斯

朴素贝叶斯以及三种常见模型推导