期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解
Posted skywalker767
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解相关的知识,希望对你有一定的参考价值。
大概想了两三天的期望DP,这么笨大概是因为高中没有好好学习,整理了下,方便以后复习。
让我们从一个题入手(绿豆蛙的归宿)
题目描述
给出张 n n n 个点 m m m 条边的有向无环图,起点为 1 1 1,终点为 n n n,每条边都有一个长度,并且从起点出发能够到达所有的点,所有的点也都能够到达终点。绿豆蛙从起点出发,走向终点。 到达每一个顶点时,如果该节点有 k k k 条出边,绿豆蛙可以选择任意一条边离开该点,并且走向每条边的概率为 1 k \\frac{1}{k} k1 现在绿豆蛙想知道,从起点走到终点的所经过的路径总长度期望是多少?
直观的想,我们只要找出所有能到达
n
n
n号点的通路,加上其概率乘以权值,就是最终答案。
E
(
x
)
=
p
1
x
1
+
p
2
x
2
+
.
.
.
.
+
p
n
x
n
E(x) = p_1x_1 + p_2x_2 + .... + p_nx_n
E(x)=p1x1+p2x2+....+pnxn
我们如果从
i
i
i点走到
j
j
j点,权值是w
那么1到y的期望为
E
(
y
)
=
p
1
(
x
1
+
w
)
+
p
2
(
x
2
+
w
)
+
.
.
.
+
p
n
(
x
n
+
w
)
E
(
y
)
=
E
(
x
)
+
∑
p
i
∗
w
可
以
推
得
E
(
y
)
的
期
望
转
移
方
程
为
E
(
y
)
=
∑
i
=
1
i
n
[
y
]
(
E
(
x
)
+
∑
p
i
∗
w
)
o
u
t
[
x
]
E(y) = p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\\\ E(y) = E(x) + ∑p_i * w\\\\ 可以推得E(y)的期望转移方程为\\\\ E(y) = ∑_{i = 1} ^ {in[y]}\\frac{(E(x) + ∑p_i * w)}{out[x]}
E(y)=p1(x1+w)+p2(x2+w)+...+pn(xn+w)E(y)=E(x)+∑pi∗w可以推得E(y)的期望转移方程为E(y)=i=1∑in[y]out[x](E(x)+∑pi∗w)
其中
1
o
u
t
[
x
]
\\frac{1}{out[x]}
out[x]1为从x点到y点的概率。
代码如下:
#include <bits/stdc++.h>
using namespace std;
const int N = 1e6 + 10;
int n , m;
double f[N];
double pro[N];
int a , b , c;
int in[N] , out[N] , w[N];
int h[N] , e[N] , ne[N] ,idx;
void add(int a , int b , int c)
{
out[a] ++ , in[b] ++ , w[idx] = c;
e[idx] = b , ne[idx] = h[a] , h[a] = idx ++;
}
void topsort()
{
queue<int> q;
f[1] = 0; pro[1] = 1;
for (int i = 1;i <= n;i ++) if (!in[i]) q.push(i);
while (q.size()) {
int x = q.front();
q.pop();
for (int i = h[x]; ~i ;i = ne[i]) {
int y = e[i];
f[y] += (f[x] + pro[x] * (double)w[i]) / (double)out[x];
pro[y] += pro[x] / (double)out[x];
if(--in[y] == 0) q.push(y);
}
}
}
int main() {
scanf("%d %d" , &n , &m);
memset(h , -1 , sizeof h);
for (int i = 0;i < m;i ++) {
scanf("%d %d %d" , &a , &b , &c);
add(a , b , c);
}
topsort();
printf("%.2lf\\n" , f[n]);
return 0;
}
这是正推的方法,下面我们来思考逆推。
正推我们找的是从
1
1
1到
i
i
i点的概率,我们称之为
p
r
o
[
i
]
pro[i]
pro[i],更新方法是
p
r
o
[
y
]
+
=
p
r
o
[
x
]
+
p
r
o
[
x
]
/
o
u
t
[
x
]
pro[y] += pro[x] + pro[x] / out[x]
pro[y]+=pro[x]+pro[x]/out[x]
逆推改怎么逆推呢?
我们假设
p
i
p_i
pi为从
i
i
i到
n
n
n点的概率,
E
(
x
)
E(x)
E(x)为从
x
x
x到
n
n
n的期望。
我们重新看一下柿子:
E
(
y
)
=
p
1
(
x
1
+
w
)
+
p
2
(
x
2
+
w
)
+
.
.
.
+
p
n
(
x
n
+
w
)
E
(
y
)
=
E
(
x
)
+
∑
p
i
∗
w
其
中
∑
p
i
=
1
E
(
y
)
=
E
(
x
)
+
w
E(y) = p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\\\ E(y) = E(x) + ∑p_i * w\\\\ 其中∑pi = 1\\\\ E(y) = E(x) + w
E(y)=p1(x1+w)+p2(x2+w)+...+pn(xn+w)E(y)=E(x)+∑pi∗w其中∑pi=1E(y)=E(x)+w
那么,与正推不同的地方是什么呢?第一,
p
i
p_i
pi的定义不同,第二,到终点的概率和一定为
1
1
1,而正推的概率和不一定为1。我们可以考虑一个记忆化搜索,这样就完美解决了这个题。
#include <bits/stdc++.h>
using namespace std;
const int N = 1e5 + 10;
const int M = N * 2;
int n , m;
double f[N];
BZOJ3036绿豆蛙的归宿 概率与期望