贝叶斯分类器
Posted 计算机鬼才~
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了贝叶斯分类器相关的知识,希望对你有一定的参考价值。
目录
错误率与风险
书接上回,我们讲到最大后验概率,我们期望把概率最大时对应的属性,当做它最终的结果。
我们自然也会思考,这样做,我们的犯错率有多大?
什么意思?就是说,在条件x的情况下,预测失误的概率(即犯错率)为1减去预测正确概率后的值。是不是有一种听君一席话,胜似一席话的感受?
那么,看懂了上述式子后,我们继续推进。不同的错误带来的损失不尽相同。比如说,如果我们把病人预测成健康的人,会导致他没能及时治疗,其损失肯定远大于把健康人预测成了病人。
显然,对每个样本x ,若 h 能最小化条件风险R(h(x)|x),则总体风险也将被最小化.这就产生了贝叶斯判定准则:为了使总体风险最小,只需在每个样本x上选择那个能使条件风险R(c|x)最小的类别,即 :
我们将h*称为贝叶斯分类器,与之对应的R(h*)称作贝叶斯风险,1-R(h*)则反映了分类器所能达到的最好性能。
更一般的,如果我们希望最小化分类错误率,即预测错误损失为1,预测成功损失为0,这样我们预测的类别,就又会变成算出最大后验概率时所对应的类别。
朴素贝叶斯分类器
讲解这方面知识,我觉得先上一个例子会好一些
好啦,现在我们决定给人美心善的伍老师找对象啦,伍老师决定从身高、帅不帅、渣不渣、声音好不好听四个角度对前来相亲的男嘉宾进行考察,再决定嫁不嫁。前来相亲的男嘉宾的条件极其结果如下:
那么根据上面的结果(伍老师可没有养鱼啊,因为种种原因孙有钱、王二麻子和朱大标不能娶伍老师),此时,高、帅、不渣、声音不好听的小明前来相亲,请替伍老师判断,该不该嫁?
对于朴素贝叶斯分类器,它的思想是避开联合概率,而采用“属性条件独立性假设”。
什么意思?就是说每个属性独立的对分类的结果发生影响。结合例子也就是说这四个属性互不影响(比如说,这个男嘉宾高不高不影响他渣不渣),单独对伍老师嫁不嫁起作用(比如说,渣不渣和高不高单独对她嫁不嫁起作用)。
所以,我们有:
注意x 是一个向量哦
我们发现,分母P(x)是个固定的值,对于分类没有影响,所以基于贝叶斯判定准则,我们只需要求出:
那么,现在的问题转化为,我们要算出嫁给高、帅、不渣、声音不好听的小明的概率,与不嫁给高、帅、不渣、声音不好听的小明的概率。把二者作比较,如果嫁的概率高于不嫁的概率,那么最终会选择嫁,反之则不嫁。
看得出来,朴素贝叶斯分类器能做很多有意义的判断,果然女生都是爱帅哥的,同时让我们恭喜男女嘉宾牵手成功!!
咳咳,扯远了,学到这里,相信大家已经对贝叶斯分类器有一定了解了。不过,贝叶斯分类器的学习还没有结束哦。欲知后事如何,请您点赞加关注,您的点赞加关注是小编写下去最大的动力!
以上是关于贝叶斯分类器的主要内容,如果未能解决你的问题,请参考以下文章