期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解

Posted 2021-09-06 skywalker767

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解相关的知识，希望对你有一定的参考价值。

大概想了两三天的期望DP，这么笨大概是因为高中没有好好学习，整理了下，方便以后复习。

让我们从一个题入手（绿豆蛙的归宿）
题目描述

给出张 $n$ 个点 $m$ 条边的有向无环图，起点为 $1$ ，终点为 $n$ ，每条边都有一个长度，并且从起点出发能够到达所有的点，所有的点也都能够到达终点。绿豆蛙从起点出发，走向终点。到达每一个顶点时，如果该节点有 $k$ 条出边，绿豆蛙可以选择任意一条边离开该点，并且走向每条边的概率为 $\\frac{1}{k}$ 现在绿豆蛙想知道，从起点走到终点的所经过的路径总长度期望是多少？

直观的想，我们只要找出所有能到达 $n$ 号点的通路，加上其概率乘以权值，就是最终答案。
$E(x) = p_1x_1 + p_2x_2 + .... + p_nx_n$
我们如果从 $i$ 点走到 $j$ 点，权值是w
那么1到y的期望为
$p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\\\ E(y) = E(x) + ∑p_i * w\\\\ 可以推得E(y)的期望转移方程为\\\\ E(y) = ∑_{i = 1} ^ {in[y]}\\frac{(E(x) + ∑p_i * w)}{out[x]}$
其中 $\\frac{1}{out[x]}$ 为从x点到y点的概率。
代码如下:

#include <bits/stdc++.h>

using namespace std;

const int N = 1e6 + 10;

int n , m;
double f[N];
double pro[N];
int a , b , c;
int in[N] , out[N] , w[N];
int h[N] , e[N] , ne[N] ,idx;

void add(int a , int b , int c)
{
    out[a] ++ , in[b] ++ , w[idx] = c;
    e[idx] = b , ne[idx] = h[a] , h[a] = idx ++;
}

void topsort()
{
    queue<int> q;
    f[1] = 0; pro[1] = 1;
    for (int i = 1;i <= n;i ++) if (!in[i]) q.push(i);
    while (q.size()) {
        int x = q.front();
        q.pop();
        
        for (int i = h[x]; ~i ;i = ne[i]) {
            int y = e[i];
            f[y] += (f[x] + pro[x] * (double)w[i]) / (double)out[x];
            pro[y] += pro[x] / (double)out[x];
            if(--in[y] == 0) q.push(y);
        }
    }
}

int main() {
    scanf("%d %d" , &n , &m);
    memset(h , -1 , sizeof h);
    for (int i = 0;i < m;i ++) {
        scanf("%d %d %d" , &a , &b  , &c);
        add(a , b , c);
    }
    topsort();
    printf("%.2lf\\n" , f[n]);
    return 0;
}

这是正推的方法，下面我们来思考逆推。
正推我们找的是从 $1$ 到 $i$ 点的概率，我们称之为 $p r o [i]$ ,更新方法是
$p r o [y] + = p r o [x] + p r o [x] / o u t [x]$
逆推改怎么逆推呢？
我们假设 $p_i$ 为从 $i$ 到 $n$ 点的概率， $E (x)$ 为从 $x$ 到 $n$ 的期望。
我们重新看一下柿子：
$E(y) = p_1(x_1 + w) + p_2(x_2 + w) + ... + p_n(x_n + w)\\\\ E(y) = E(x) + ∑p_i * w\\\\ 其中∑pi = 1\\\\ E(y) = E(x) + w$
那么，与正推不同的地方是什么呢？第一， $p_i$ 的定义不同，第二，到终点的概率和一定为 $1$ ，而正推的概率和不一定为1。我们可以考虑一个记忆化搜索，这样就完美解决了这个题。

#include <bits/stdc++.h>
using namespace std;

const int N = 1e5 + 10;
const int M = N * 2;

int n , m;
double f[N];
BZOJ3036绿豆蛙的归宿 概率与期望
 《算法竞赛进阶指南》0x38概率与数学期望 绿豆蛙的归宿
 题解 bzoj3036: 绿豆蛙的归宿 （期望dp）
 P4316 绿豆蛙的归宿 期望DP
 Luogu_P4316 绿豆蛙的归宿  期望DP
 cogs 1065 绿豆蛙的归宿 图上概率dp