遍历具有联合概率分布的 4x4 网格世界的概率代理
Probabilistic agent traversing a 4x4 grid world with joint probability distribution
我正在尝试解决 A Modern Approach to AI 一书中的简单棋盘游戏的概率代理,但我在基本数学和主要是完整联合分布方面遇到了一些麻烦,所以我要求一些指点。
棋盘是4x4的正方形
棋盘某处有 1 个怪物和 2 个坑
如果附近有pits/monsters
,怪物和坑会在其相邻的方格中给出一个stench/breeze给代理人线索
房间在网格上写成元组坐标:(x,y) 从 1-4
例如:
访问房间 (1, 1), (1, 2), (2, 1),我们发现
breeze房间 (1, 2) 和 (2, 1)
这告诉我在 (1, 2) 和 (2, 1) 相邻的房间中可能有坑
P是坑的概率
这个变量在开始时均匀分布在 4x4 网格(16 个房间)上,所以我们得到每个方格有坑或怪物的概率为 0.2
B是访问过的房间是否有breeze或恶臭(也就是说旁边是坑的概率更高
完整的联合分布应该是 P(P11, …, P44, B11, B12, B21)
产品规则给我们
P(P11, …, P44, B11, B12, B21) =
P(B11, B12, B21 | P11, …, P44) P(P11, …, P44)
Product Rule on Full Joint Distribution
到目前为止一切顺利,但我似乎无法进行下一步。
我的第二个术语是因为它在房间内均匀分布的概率为 0.2。
但是对于第一个术语,如果带有 breeze 的房间(B21 和 B12)与 pit/monster 相邻,则应该有 1。但是 B 的数字是多少?我如何得到它?
AIMA 书中指出:“第一项是 breeze 配置的条件概率分布,给定一个坑配置;如果 breeze 与凹坑相邻,则其值为 1,否则为 0”
我已经为此苦苦挣扎了好几天,但毫无进展。任何帮助将不胜感激。
Bxy 值指示是否在单元格 xy 中观察到 breeze。它们的正式定义为:
Bxy = 1 当且仅当在 (x, y),
中观察到 breeze
Bxy = 0 否则
因此,在您的示例情况下,我们已经知道
B11 = 0, B12 = 1, B21 = 1
同理,变量P11,P12,...,P44也是二元变量,其中Pxy=1当且仅当单元格(x,y)中有坑时
现在看看第一个术语,我相信这就是你的问题,你不明白的事情:
P(B11, B12, B21 | P11, ..., P44)
这是在 Pxy = 1 的单元格 (x, y) 中存在凹坑的情况下进行观察 (B11, B12, B21) 的条件概率分布。
在示例情况下,您可以填写 B11、B12 和 B21 的值。您知道 B11 = 0,并且 B12 = B21 = 1(因为这是观察到的)。你不知道坑在哪些位置,所以你不能直接根据你的情况直接填写Pxy值。但是,您可以为您能想到的任意情况填写这些值。
你可以说"ok, let's assume there is only a pit in location (1, 3)"。然后我们有 P13 = 1,所有其他 Pxy = 0。对于这种特定情况,也可以计算该特定情况发生的概率(将为 0,因为您无法观察到 breeze in (2, 1) 如果 (1, 3) 中只有一个坑)。
如果你对所有你能想到的可能情况重复这个,你可以结合结果得到更有趣的答案,比如根据你所做的观察,在某个位置有坑的概率。这就是下面的文字的内容,我相信这不再是你的问题。
我正在尝试解决 A Modern Approach to AI 一书中的简单棋盘游戏的概率代理,但我在基本数学和主要是完整联合分布方面遇到了一些麻烦,所以我要求一些指点。
棋盘是4x4的正方形 棋盘某处有 1 个怪物和 2 个坑 如果附近有pits/monsters
,怪物和坑会在其相邻的方格中给出一个stench/breeze给代理人线索房间在网格上写成元组坐标:(x,y) 从 1-4
例如:
访问房间 (1, 1), (1, 2), (2, 1),我们发现 breeze房间 (1, 2) 和 (2, 1)
这告诉我在 (1, 2) 和 (2, 1) 相邻的房间中可能有坑
P是坑的概率 这个变量在开始时均匀分布在 4x4 网格(16 个房间)上,所以我们得到每个方格有坑或怪物的概率为 0.2
B是访问过的房间是否有breeze或恶臭(也就是说旁边是坑的概率更高
完整的联合分布应该是 P(P11, …, P44, B11, B12, B21)
产品规则给我们
P(P11, …, P44, B11, B12, B21) =
P(B11, B12, B21 | P11, …, P44) P(P11, …, P44)
Product Rule on Full Joint Distribution
到目前为止一切顺利,但我似乎无法进行下一步。
我的第二个术语是因为它在房间内均匀分布的概率为 0.2。 但是对于第一个术语,如果带有 breeze 的房间(B21 和 B12)与 pit/monster 相邻,则应该有 1。但是 B 的数字是多少?我如何得到它?
AIMA 书中指出:“第一项是 breeze 配置的条件概率分布,给定一个坑配置;如果 breeze 与凹坑相邻,则其值为 1,否则为 0”
我已经为此苦苦挣扎了好几天,但毫无进展。任何帮助将不胜感激。
Bxy 值指示是否在单元格 xy 中观察到 breeze。它们的正式定义为:
Bxy = 1 当且仅当在 (x, y),
中观察到 breeze
Bxy = 0 否则
因此,在您的示例情况下,我们已经知道
B11 = 0, B12 = 1, B21 = 1
同理,变量P11,P12,...,P44也是二元变量,其中Pxy=1当且仅当单元格(x,y)中有坑时
现在看看第一个术语,我相信这就是你的问题,你不明白的事情:
P(B11, B12, B21 | P11, ..., P44)
这是在 Pxy = 1 的单元格 (x, y) 中存在凹坑的情况下进行观察 (B11, B12, B21) 的条件概率分布。
在示例情况下,您可以填写 B11、B12 和 B21 的值。您知道 B11 = 0,并且 B12 = B21 = 1(因为这是观察到的)。你不知道坑在哪些位置,所以你不能直接根据你的情况直接填写Pxy值。但是,您可以为您能想到的任意情况填写这些值。
你可以说"ok, let's assume there is only a pit in location (1, 3)"。然后我们有 P13 = 1,所有其他 Pxy = 0。对于这种特定情况,也可以计算该特定情况发生的概率(将为 0,因为您无法观察到 breeze in (2, 1) 如果 (1, 3) 中只有一个坑)。
如果你对所有你能想到的可能情况重复这个,你可以结合结果得到更有趣的答案,比如根据你所做的观察,在某个位置有坑的概率。这就是下面的文字的内容,我相信这不再是你的问题。