朴素贝叶斯:基于概率论的分类模型
Posted 生信修炼手册
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了朴素贝叶斯:基于概率论的分类模型相关的知识,希望对你有一定的参考价值。
通过比较不同事件发生的概率,选取概率大的事件作为最终的分类。在朴素贝叶斯中, 为了简化计算,假设各个特征之间相互独立, 这也是为何称之为"朴素"的原因。
以下列数据为例,这是一份统计早上是否出去打高尔夫的样本数据,相关的特征有4个
P(yes|sunny, hot, high, false) = P(sunny, hot, high, false|yes) * P(yes) / P(sunny, hot, high, false)
=P(sunny|yes) * P(hot|yes) * P(high|yes) * P(false|yes) * P(play) / (P(sunny) * P(hot) * P(high) * P(false))
此时,只需要利用输入的样本数据来计算各个概率,以sunny相关的概率为例,计算过程如下
根据大数定理,直接用样本中的频数作为概率,简单统计一下,就可以得到各个条件概率。
带入公式就可以算出具体的概率值
# P(yes|sunny, hot, high, false)
>>> (3/9) * (2/9) * (3/9) * (6/9) * (9/14) / ((5/14) * (4/14) * (7/14) * (8/14))
以上是关于朴素贝叶斯:基于概率论的分类模型的主要内容,如果未能解决你的问题,请参考以下文章