[DM]分类-贝叶斯分类

Posted 2021-04-25 优化算法交流地

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了[DM]分类-贝叶斯分类相关的知识，希望对你有一定的参考价值。

当前浏览器不支持播放音乐或语音，请在微信或其他浏览器中播放 [DM]分类-贝叶斯分类

本文根据清华大学袁博老师慕课网视频整理

本文目录如下：

一、贝叶斯定理

二、朴素贝叶斯

三、拉普拉斯平滑

四、例子

一、贝叶斯定理

我们高中学过条件概率，

[DM]分类-贝叶斯分类

后验概率 [DM]分类-贝叶斯分类表示在事件B发生的情况下事件A发生的概率。

通常，事件A在事件B发生的条件下的概率，与事件B在事件A的条件下的概率是不一样的；然而这两者有确定的关系,贝叶斯法则就是这种关系的陈述。

贝叶斯定理表达式：

[DM]分类-贝叶斯分类

举一个用贝叶斯公式求后验概率的简单例子，大家可能会很熟悉：

某射击训练中，射手甲的命中率是0.6，P(甲)=0.6，射手乙的命中率是0.5，P(乙)=0.5。现在甲、乙同时朝同一靶子射一枪，靶子被击中，求甲射中的概率。

靶子被击中P(中)有三种可能：

甲✔乙✘

甲✔乙✔

甲✘乙✔

代入贝叶斯公式我们很容易求出来：

[DM]分类-贝叶斯分类

二、朴素贝叶斯

朴素贝叶斯算法在解决数据挖掘分类问题中，用概率的形式表示数据的分类情况。属于监督学习的生成模型，实现简单，没有迭代，并有坚实的数学理论作为支撑。在大量样本下有较好的表现。

“朴素”是naïve一词的译意，表示在进行先验概率计算时暗含的一个假设：事件互相条件独立。

朴素贝叶斯问题表示如下：

[DM]分类-贝叶斯分类

我们提出假设，在ωi发生的情况下， [DM]分类-贝叶斯分类事件相互独立。

[DM]分类-贝叶斯分类

所以原问题转化为 [DM]分类-贝叶斯分类条件独立问题：

条件独立在贝叶斯网络中有三种形式：

1 head-to-head

[DM]分类-贝叶斯分类

指在c未知的条件下，a、b是独立的。

[DM]分类-贝叶斯分类

例如我不知到我是否感冒的情况下，头疼和身子没劲两事件并没有直接关系，相对独立。

2 tail-to-tail

[DM]分类-贝叶斯分类

在c 已知的情况下，a、b 独立。

如下如，7*7的网格内部有3中基本颜色，红(R)、黄(Y)、蓝(B)，三种颜色重叠的部分发生了颜色变化。

[DM]分类-贝叶斯分类

从整个网格的数据来看，R、B 不独立。

[DM]分类-贝叶斯分类

那么在黄色区域内部，R、B 独立。

[DM]分类-贝叶斯分类

3 head-to-tail

[DM]分类-贝叶斯分类

经常看到报道说男人比女人更容易得肺癌，单单从实际数据上看也确实如此。但稍微结合常识考虑一下，在男人(a)和得肺癌(b)两事件中间，还有一个十分重要的事件，吸烟(c)。男人爱抽烟，抽烟爱得肺癌。男人(a)，吸烟(c)，得肺癌(b)三事件就组成了一个基于head-to-tail形状的案例。所以身为男人与得肺癌两事件相对独立。

三、拉普拉斯平滑

如果某类数据性状不常出现，我们得到的数据中可能就不包含该类性状的数据。那么在计算朴素贝叶斯时，因为

[DM]分类-贝叶斯分类