期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解

Posted skywalker767

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解相关的知识,希望对你有一定的参考价值。

大概想了两三天的期望DP,这么笨大概是因为高中没有好好学习,整理了下,方便以后复习。

让我们从一个题入手(绿豆蛙的归宿
题目描述

给出张 n n n 个点 m m m 条边的有向无环图,起点为 1 1 1,终点为 n n n,每条边都有一个长度,并且从起点出发能够到达所有的点,所有的点也都能够到达终点。绿豆蛙从起点出发,走向终点。 到达每一个顶点时,如果该节点有 k k k 条出边,绿豆蛙可以选择任意一条边离开该点,并且走向每条边的概率为 1 k \\frac{1}{k} k1 现在绿豆蛙想知道,从起点走到终点的所经过的路径总长度期望是多少?

直观的想,我们只要找出所有能到达 n n n号点的通路,加上其概率乘以权值,就是最终答案。
E ( x ) = p 1 x 1 + p 2 x 2 + . . . . + p n x n E(x) = p_1x_1 + p_2x_2 + .... + p_nx_n E(x)=p1x1+p2x2+....+pnxn
我们如果从 i i i点走到 j j j点,权值是w
那么1到y的期望为
E ( y ) = p 1 ( x 1 + w ) + p 2 ( x 2 + w ) + . . . + p n ( x n + w ) E ( y ) = E ( x ) + ∑ p i ∗ w 可 以 推 得 E ( y ) 的 期 望 转 移 方 程 为 E ( y ) = ∑ i = 1 i n [ y ] ( E ( x ) + ∑ p i ∗ w ) o u t [ x ] E(y) = p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\\\ E(y) = E(x) + ∑p_i * w\\\\ 可以推得E(y)的期望转移方程为\\\\ E(y) = ∑_{i = 1} ^ {in[y]}\\frac{(E(x) + ∑p_i * w)}{out[x]} E(y)=p1(x1+w)+p2(x2+w)+...+pn(xn+w)E(y)=E(x)+piwE(y)E(y)=i=1in[y]out[x](E(x)+piw)
其中 1 o u t [ x ] \\frac{1}{out[x]} out[x]1为从x点到y点的概率。
代码如下:

#include <bits/stdc++.h>

using namespace std;

const int N = 1e6 + 10;

int n , m;
double f[N];
double pro[N];
int a , b , c;
int in[N] , out[N] , w[N];
int h[N] , e[N] , ne[N] ,idx;

void add(int a , int b , int c)
{
    out[a] ++ , in[b] ++ , w[idx] = c;
    e[idx] = b , ne[idx] = h[a] , h[a] = idx ++;
}

void topsort()
{
    queue<int> q;
    f[1] = 0; pro[1] = 1;
    for (int i = 1;i <= n;i ++) if (!in[i]) q.push(i);
    while (q.size()) {
        int x = q.front();
        q.pop();
        
        for (int i = h[x]; ~i ;i = ne[i]) {
            int y = e[i];
            f[y] += (f[x] + pro[x] * (double)w[i]) / (double)out[x];
            pro[y] += pro[x] / (double)out[x];
            if(--in[y] == 0) q.push(y);
        }
    }
}

int main() {
    scanf("%d %d" , &n , &m);
    memset(h , -1 , sizeof h);
    for (int i = 0;i < m;i ++) {
        scanf("%d %d %d" , &a , &b  , &c);
        add(a , b , c);
    }
    topsort();
    printf("%.2lf\\n" , f[n]);
    return 0;
}

这是正推的方法,下面我们来思考逆推。
正推我们找的是从 1 1 1 i i i点的概率,我们称之为 p r o [ i ] pro[i] pro[i],更新方法是
p r o [ y ] + = p r o [ x ] + p r o [ x ] / o u t [ x ] pro[y] += pro[x] + pro[x] / out[x] pro[y]+=pro[x]+pro[x]/out[x]
逆推改怎么逆推呢?
我们假设 p i p_i pi为从 i i i n n n点的概率, E ( x ) E(x) E(x)为从 x x x n n n的期望。
我们重新看一下柿子:
E ( y ) = p 1 ( x 1 + w ) + p 2 ( x 2 + w ) + . . . + p n ( x n + w ) E ( y ) = E ( x ) + ∑ p i ∗ w 其 中 ∑ p i = 1 E ( y ) = E ( x ) + w E(y) = p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\\\ E(y) = E(x) + ∑p_i * w\\\\ 其中∑pi = 1\\\\ E(y) = E(x) + w E(y)=p1(x1+w)+p2(x2+w)+...+pn(xn+w)E(y)=E(x)+piwpi=1E(y)=E(x)+w
那么,与正推不同的地方是什么呢?第一, p i p_i pi的定义不同,第二,到终点的概率和一定为 1 1 1,而正推的概率和不一定为1。我们可以考虑一个记忆化搜索,这样就完美解决了这个题。

#include <bits/stdc++.h>
using namespace std;

const int N = 1e5 + 10;
const int M = N * 2;

int n , m;
double f[N];
BZOJ3036绿豆蛙的归宿 概率与期望

《算法竞赛进阶指南》0x38概率与数学期望 绿豆蛙的归宿

题解 bzoj3036: 绿豆蛙的归宿 (期望dp)

P4316 绿豆蛙的归宿 期望DP

Luogu_P4316 绿豆蛙的归宿 期望DP

cogs 1065 绿豆蛙的归宿 图上概率dp