4-1 朴素贝叶斯 模型公式的推导
Posted windmissing
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了4-1 朴素贝叶斯 模型公式的推导相关的知识,希望对你有一定的参考价值。
假设A和B是两个事件,根据贝叶斯公式:
P
(
A
∣
B
)
∗
P
(
B
)
=
P
(
A
,
B
)
=
P
(
B
∣
A
)
P
(
A
)
P(A|B) * P(B) = P(A, B) = P(B|A)P(A)
P(A∣B)∗P(B)=P(A,B)=P(B∣A)P(A)
又假如在这两个事件中,我们关注的是事件A,那么称:
P(A)为先验概率,即A发生的概率
P(B|A)为条件概率
P(A|B)为后验概率
根据先验概率和条件概率求后验概率:
P
(
A
∣
B
)
=
P
(
B
∣
A
)
P
(
A
)
P
(
B
)
P(A|B) = \\frac P(B|A)P(A)P(B)
P(A∣B)=P(B)P(B∣A)P(A)
在朴素贝叶斯模型中,将
Y
=
C
k
Y=C_k
Y=Ck
看
作
是
事
件
A
,
将
看作是事件A,将
看作是事件A,将
X
=
x
X=x
X=x看作事件B,根据给定的输入x求Y得到不同值的概率:
P
(
Y
=
C
k
∣
X
=
x
)
=
P
(
X
=
x
∣
Y
=
C
k
)
P
(
Y
=
C
k
)
P
(
X
=
x
)
(1)
P(Y=C_k|X=x) = \\frac P(X=x|Y=C_k)P(Y=C_k)P(X=x) \\tag1
P(Y=Ck∣X=x)=P(X=x)P(X=x∣Y=Ck)P(Y=Ck)(1)
公式(1)中
P
(
Y
=
C
k
)
P(Y=C_k)
P(Y=Ck)是先验概率,可以直接根据样本计算出来。
公式(1)中的
P
(
X
=
x
∣
Y
=
C
k
)
P(X=x|Y=C_k)
P(X=x∣Y=Ck)不能由样本直接计算。
将x展开为
x
=
(
x
(
1
)
,
x
(
2
)
,
⋯
,
x
(
n
)
)
(2)
x=(x^(1),x^(2),\\cdots,x^(n)) \\tag 2
x=(x(1),x(2),⋯,x(n))(2)
根据朴素贝叶斯模型中对数据的假设:用于分类的特征在类确定的条件下都是条件独立的。公式(2)中的KaTeX parse error: Expected '', got 'EOF' at end of input: …,\\cdots,x^(n)就是这些条件独立的特征,得到:
P
(
X
=
x
∣
Y
=
C
k
)
=
P
(
X
=
(
x
(
1
)
,
x
(
2
)
,
⋯
,
x
(
n
)
)
∣
Y
=
C
k
)
=
P
(
x
(
1
)
∣
y
=
C
k
)
∗
P
(
x
(
2
)
∣
y
=
C
k
)
∗
⋯
∗
P
(
x
(
n
)
∣
y
=
C
k
)
(3)
P(X=x|Y=C_k) \\\\ = P(X=(x^(1),x^(2),\\cdots,x^(n))|Y=C_k) \\\\ = P(x^(1)|y=C_k)*P(x^(2)|y=C_k)*\\cdots*P(x^(n)|y=C_k) \\tag 3
P(X=x∣Y=Ck)=P(X=(x(1),x(2),⋯,x(n))∣Y=Ck)=P(x(1)∣y=Ck)∗P(x(2)∣y=Ck)∗⋯∗P(x(n)∣y=Ck)(3)
公式(3)中的每个P(x|y)都能根据样本计算出来,最终计算出总的
P
(
X
=
x
∣
Y
=
C
k
)
P(X=x|Y=C_k)
P(X=x∣Y=Ck)
公式(1)中的P(X=x)可根据概率论公式得出:
P
(
X
=
x
)
=
∑
k
P
(
Y
=
C
k
)
∏
j
P
(
X
(
j
)
=
x
(
j
)
∣
y
=
C
k
)
(4)
P(X=x) = \\sum_k P(Y=C_k)\\prod_jP(X^(j)=x^(j)|y=C_k) \\tag 4
P(X=x)=k∑P(Y=Ck)j∏P(X(j)=x(j)∣y=Ck)(4)
把公式(3)、(4)代入公式(1)得:
P
(
Y
=
C
k
∣
X
=
x
)
=
P
(
Y
=
C
k
)
∏
j
P
(
X
(
j
)
=
x
(
j
)
∣
y
=
C
k
)
∑
k
P
(
Y
=
C
k
)
∏
j
P
(
X
(
j
)
=
x
(
j
)
∣
y
=
C
k
)
,
k
=
1
,
2
,
⋯
,
K
P(Y=C_k|X=x) = \\frac P(Y=C_k)\\prod_jP(X^(j)=x^(j)|y=C_k)\\sum_k P(Y=C_k)\\prod_jP(X^(j)=x^(j)|y=C_k), k=1,2,\\cdots,K
P(Y=Ck∣X=x)=∑kP(Y=Ck)∏jP(X(j)=x(j)∣y=Ck)P(Y=Ck)∏j4-1 朴素贝叶斯 模型公式的推导