贝叶斯网络——D分离的介绍

Posted justno

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了贝叶斯网络——D分离的介绍相关的知识,希望对你有一定的参考价值。

D分离——贝叶斯网络

文章结尾有例题分析。

基本概念

D分离的概念来自于贝叶斯网络,是用来寻找条件独立的有效方法

条件独立性:有节点A,B,C,如果有

? (P(A|B,C)=P(A|B))

即给定B(或者说B已确定)时,C的任何信息都不能改变A的可信度度量,则称A和C是在B的条件下独立的.

条件独立性有什么用呢?

答案是帮助我们简化贝叶斯网络的联合概率的计算

有向网络连接中节点间的三个基本关系

由于贝叶斯网络是一个DAG(有向无环图)网络。所以节点间的关系基本分为三类。

(1) 串行连接

? 在串行连接中A通过事件B影响C,同样事件C也是用过事件B影响A。我们认为当证据B确定时,A、C条件独立。

称A和C被B节点D分离。

技术图片

(2) 分叉连接

? 在分叉连接中A影响子节点,同样子节点通过A影响其他子节点。我们认为当A已知时,其各个子节点相互独立。称B、C、...、Z被A节点D分离。

技术图片

(3) 汇集连接(比较特殊)

? 在汇集连接中只有A节点未知时,我们才能认为其父节点们相互独立。

技术图片

值得需要注意的是,如果某节点影响了节点A或者节点A的后代节点,我们认为其父节点们并不相互独立。

技术图片

如上图,事件e直接影响了A,那么B、C...、Z并不独立

技术图片

如上图,事件e直接影响了A的后代结点E,那么B、C...、Z并不独立。

D分离的条件

下面给出D分离的严格数学定义。

给定证据结点集??,若对贝叶斯网络中(V_{i}, V_{j})结点 之间的每一个无向路径都有某个结点(V_{b})。若(V_{b})存在以下三个属性之一,那么该无向路径被(V_{b})阻塞。

  1. ? (V_{b})在??中,且路径上的两条弧都以(V_{b})结尾。 ((V_{b})相当于分叉连接中的A节点)
  2. ? (V_{b})在??中,且路径上的一条弧以(V_{b})为头,一条弧以(V_{b})结尾。 ((V_{b})相当于串行连接中的B节点)
  3. ? (V_{b})及其后代结点都不在??中,且路径上的两条弧都以(V_{b})为头。((V_{b})相当于汇集连接中的A节点)

若贝叶斯网络中(V_{i}, V_{j})结点 之间的每一个无向路径都被阻塞,那么我们称(V_{i}, V_{j})结点被证据集?? D分离。

实例分析

技术图片

例1:如上图,利用D分离简化联合概率密度计算

利用条件独立性简化计算前:

(P(B,R,I,G,S,M)=P(M|B,R,I,G,S)*P(S|B,R,I,G)*P(G|B,R,I)*P(I|B,R)*P(R|B)*P(B))

利用条件独立性简化计算后:

(P(B,R,I,G,S,M)=P(M|S)*P(S|I,G)*P(G)*P(I|B)*P(R|B)*P(B))

下面逐一分析:

(P(M|B,R,I,G,S)),可以被这样解决,给定节点B,R,I,G,S(可视为证据结点),判断它与那些节点条件独立,然后按照条件独立性化简。

  • M,S直接连接,必然有影响,不独立。
  • 给定S后,B,R,I,G.到M的所有无向路径被S阻塞。按照条件独立性(P(M|B,R,I,G,S)=P(M|S))

(P(S|B,R,I,G)),同理。

  • I,G和S直连,必然相互影响,不独立。
  • 给定I后,B,R到S的所有无向路径被I阻塞。B,R和I条件独立,按照条件独立性(P(S|B,R,I,G)=P(S|I,G))

(P(G|B,R,I)),同理

  • B,R,I中没有结点阻塞G到B,R,I的所有无向路径。因为S没有给出且S的后代结点没有被给出结点B,R,I影响。所以B,R,I和G条件独立。(P(G|B,R,I)=P(G))

(P(I|B,R)),同理

  • 给定B后,RBI路径被B阻塞,所以R,I在B的条件下独立。(P(I|B,R)=P(I|B))

例2:如下图,有三问

技术图片

a) 列出从B到S所有无向路径

b) 给定证据结点D,那么a)中哪些无向路径被阻塞?

c) 等式(P(S|B,D)=P(S|D))是否成立,为什么?

答:

a) 从B到S利用深度优先搜索的思路找到所有无向路径。

? BDS,BDCS,BDACS

b) BDS,被D阻塞(B,S串行连接被D阻塞);BDACS,未被阻塞(A,B汇集连接处D已知,路径未阻塞);BDCS,未被阻塞(C,B汇集连接处D已知,路径未阻塞);

c) 由b)可知,B,S之间所有无向路径并未都被阻塞,B,S并不条件独立,所以等式(P(S|B,D)=P(S|D))不成立。

以上是关于贝叶斯网络——D分离的介绍的主要内容,如果未能解决你的问题,请参考以下文章

04 贝叶斯算法 - 贝叶斯网络

从贝叶斯方法谈到贝叶斯网络

从贝叶斯方法谈到贝叶斯网络

贝叶斯网络

贝叶斯网络

数据挖掘算法之贝叶斯网络