遍历具有联合概率分布的 4x4 网格世界的概率代理

Posted

技术标签:

【中文标题】遍历具有联合概率分布的 4x4 网格世界的概率代理【英文标题】:Probabilistic agent traversing a 4x4 grid world with joint probability distribution 【发布时间】:2017-01-11 19:26:24 【问题描述】:

我正在尝试从《A Modern Approach to AI》一书中解决一个简单棋盘游戏的概率代理,但在基本数学和主要是完整的联合分布方面遇到了一些问题,所以我想请教一些指点.

棋盘是 4x4 方格 棋盘上某处有 1 个怪物和 2 个坑 如果附近有坑/怪物,怪物和坑会在其相邻的方格中发出恶臭/微风,为特工提供线索

将房间写成它们在网格上坐标的元组:(x,y) from 1-4

例如:

房间 (1, 1), (1, 2), (2, 1) 被访问并且我们发现 房间 (1, 2) 和 (2, 1) 中的微风

这告诉我,与 (1, 2) 和 (2, 1) 相邻的任何一个房间都可能有坑

P 是坑的概率 这个变量在开始时均匀分布在 4x4 网格(16 个房间)上,所以我们得到每平方有一个坑或怪物的概率为 0.2

B是访问过的房间是否有微风或恶臭(这意味着它是他们旁边的坑的概率更高

那么完整的联合分布应该是 P(P11, ..., P44, B11, B12, B21)

产品规则告诉我们

P(P11, ..., P44, B11, B12, B21) =

P(B11, B12, B21 | P11, ..., P44) P(P11, ..., P44)

Product Rule on Full Joint Distribution

到目前为止一切顺利,但我似乎无法采取下一步行动。

自从它在房间内均匀分布的概率为 0.2 以来,我得到的第二个术语。 但是对于第一个学期,如果有微风的房间(B21 和 B12)与坑/怪物相邻,则应该有 1。但是 B 的数字是多少?我怎么得到它?

AIMA 书中指出:“第一项是微风配置的条件概率分布,给定一个坑配置;如果微风与坑相邻,则其值为 1,否则为 0”

我已经为此苦苦挣扎了好几天,但毫无进展。任何帮助将不胜感激。

【问题讨论】:

"...在开始时均匀分布在 4x4 网格(16 个房间)上,因此我们得到每平方有一个坑或怪物的概率为 0.2"。我错过了什么还是应该是 3/16 = 0.1875 的概率? 我在这里有点困惑。 P11 可以取什么值?根据 (1,1) 是否包含坑/野兽,它是 0 还是 1?让随机变量输出坑的实际位置似乎更自然一些,而不是为世界上的位置创建一个二进制是/否随机变量。你能链接到你正在使用的教科书中的问题吗? 我同意这非常令人困惑。它的 3/15 因为“英雄”从其中一个方格开始,所以从 3/15 = 0.2 开始只有 15 个是未知的。我正在尝试重新创建 Russel & Norvig 所著的《人工智能的现代方法》一书中第 499 页的第 13.6 章。它看起来很简单,但我无法理解它。 “对于具有恰好 n 个坑的特定配置,P (P1,1, . . . , P4,4) = 0.2^n × 0.8^16−n。”(Norvig, p500) 你说的是哪一版的书页/章节号? 【参考方案1】:

Bxy 值表示在单元 xy 中是否观察到微风。它们被正式定义为:

Bxy = 1 当且仅当在 (x, y) 观察到微风时, bxy = 0 否则

因此,在您的示例情况下,我们已经知道 B11 = 0, B12 = 1, B21 = 1

同样,变量 P11, P12, ..., P44 也是二进制变量,其中 Pxy = 1 当且仅当单元格 (x, y) 中有坑。

现在来看看第一个术语,我相信这是你的问题,你不明白的东西:

P(B11, B12, B21 | P11, ..., P44)

这是在 Pxy = 1 的单元格 (x, y) 中存在凹坑的情况下进行观察 (B11, B12, B21) 的条件概率分布。

在示例情况下,您可以填写 B11、B12 和 B21 的值。你知道 B11 = 0 和 B12 = B21 = 1(因为这是观察到的)。您不知道坑在哪些位置,因此您无法针对您的具体情况直接填写 Pxy 值。但是,您可以为您能想到的任意情况填写这些值。

您可以说“好的,假设在 (1, 3) 位置只有一个坑”。然后我们有 P13 = 1,所有其他 Pxy = 0。对于这样一个特定情况,也可以计算该特定情况发生的概率(这将是 0,因为你无法在 (2 , 1) 如果 (1, 3)) 中只有一个坑。

如果您对您能想象到的所有可能情况重复此操作,您可以结合结果来获得更有趣的答案,例如在给定您所做的观察的情况下,某个位置存在坑的概率。不过,这就是下文的内容,我相信这不再是您的问题所在。

【讨论】:

以上是关于遍历具有联合概率分布的 4x4 网格世界的概率代理的主要内容,如果未能解决你的问题,请参考以下文章

联合概率分布怎么做?

概率论 联合分布律

人工智能数学基础--概率与统计4:联合分布与边缘分布

人工智能数学基础--概率与统计4:联合分布与边缘分布

概率统计笔记:高斯分布的联合概率密度

如何从联合、离散、概率分布函数中进行数值采样