动态规划数学期望/概率DP/期望DP详解

Posted 繁凡さん

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了动态规划数学期望/概率DP/期望DP详解相关的知识,希望对你有一定的参考价值。

期望DP

概述

1.数学期望

(1)概念

如果X是在概率空间 ( Ω , F , P ) (Ω, F, P) Ω,F,P中的随机变量,那么它的期望值 E [ X ] E[X] E[X]的定义是:
e x p e c t a t i o n expectation expectation

也就是试验中每次可能的结果乘以其结果概率的总和。

换句话说,期望等于每个数出现的概率乘以每个数的值

(2)性质

  • 线性 l i n e a r linear linear

  • 期望具有线性关系: E ( a x 1 + b x 2 + . . . ) = a E ( x 1 ) + b E ( x 2 ) + . . . E(ax1+bx2+...)=aE(x1)+bE(x2)+... E(ax1+bx2+...)=aE(x1)+bE(x2)+...

  • 在一般情况下,两个随机变量的积的期望值不等于这两个随机变量的期望值的积。

  • E [ X Y ] = E [ x ] E [ y ] E[XY]=E[x]E[y] E[XY]=E[x]E[y]成立时,随机变量 X X X Y Y Y的协方差为 0 0 0,又称它们不相关。特别的,当两个随机变量独立时,它们协方差(若存在)为 0 0 0

  • 也就是说,当X,Y,相对独立,则有:

  • 期望值也可以通过方差计算公式来计算方差
    其中 V a r ( X ) Var(X) VarX指的是方差

  • C是常数

2.全期望公式


所以

根据已经求出的期望推出其他状态的期望,也可以根据一些特点和结果相同的情况,求出其概率。
这就引出了我们的期望dp

3.期望dp

对于一些比较难找到递推关系的数学期望问题,可以利用期望的定义式,根据实际情况以概率或者方案数(也就是概率*总方案数)作为一种状态,而下标直接或间接对应了这个概率下的变量值,将问题变成比较一般的统计方案数问题或者利用全概率公式计算概率的递推问题

一般来说,概率DP找到正确的状态定义后,转移是比较容易想到的。但状态一定是“可数”的,把有范围的整数作为数组下标。事实上,将问题直接作为状态是最好的。如问“n人做X事的期望次数”,则设计状态为f[i]表示i个人做完事的期望。转移一般是递推,即从上一个状态转移得(填表)或转移向下一个状态(刷表)。

有时期望DP需以最终状态为初始状态转移,即逆推。如f[i]表示期望还要走f[i]步到达终点。这种状态的转移是刷表法,形如 f [ i ] = ∑ p [ i → j ] f [ j ] + w [ i → j ] f[i]=∑p[i→j]f[j]+w[i→j] f[i]=p[ij]f[j]+w[ij],其中p[ ]表示转移的概率,w[ ]表示转移对答案的贡献。一般来说,初始状态确定时可用顺推,终止状态确定时可用逆推。

规律

1.期望可以分解成多个子期望的加权和,权为子期望发生的概率,即
E ( a A + b B + … ) = a E ( A ) + b E ( B ) + … + 1 E(aA+bB+…) = aE(A) + bE(B) +…+1 E(aA+bB+)=aE(A)+bE(B)++1
2.期望从后往前找,一般 d p [ n ] = 0 , d p [ 0 ] dp[n]=0,dp[0] dp[n]=0,dp[0]是答案;
3.解决过程,找出各种情况乘上这种情况发生的概率,求和;
4.概率DP一定要初始化!

转移方程

几种常见设转移方程数组的方法

  1. f [ i ] f[i] f[i]表示的是由i状态变成 最终 状态的期望
  2. 按照题意直接设
  3. 把选择的东西加入数组,如 f [ i ] [ j ] f[i][j] f[i][j]表示第 i i i 个物品选 j j j 个的期望或 f [ i ] [ j ] f[i][j] f[i][j]表示有 i i i A A A物品, j j j B B B物品的期望

求转移方程
应优先考虑进行操作后当前状态会怎么样,而不是如何变成当前状态,即先考虑 逆向,如果逆向没有思路,则考虑 正向

全概率公式


公式表示若事件A1,A2,…,An构成一个完备事件组且都有正概率,则对任意一个事件B都有公式成立。

假如事件A与B相互独立,那么:

一、期望DP例题

1.UVA11021 Tribles麻球繁衍

UVA11021 Tribles麻球繁衍
题意翻译
题目大意
一开始有k种生物,这种生物只能活1天,死的时候有 p i p_i pi的概率产生ii只这种生物(也只能活一天),询问m天内所有生物都死的概率(包括m天前死亡的情况)
输入格式
第一行输入一个整数T,表示数据总数
每一组先输入三个整数n(1<=n<=1000),k(0<=k<=1000),m(0<=m<=1000)
然后输入n个整数,分别为 p 0 p_0 p0 p n − 1 p_n-1 pn1

对于每一组数据,先输出"Case #x: " 再输出答案,精度要求在1e-6以内

———————————————————————————————————

思路:每个麻球是互相独立的,设计状态f[i]表示一个麻球i天内死绝的概率,则n个麻球在i天内死亡的概率是 f [ i ] n f[i]^n f[i]n 。转移时考虑这个麻球第一天繁衍多少个,它们在接下来的i−1天内死绝了。转移方程为 f [ i ] = ∑ j = 0 k − 1 p [ j ] f [ i − 1 ] j f[i]=\\sum_j=0^k-1p[j]f[i-1]^j f[i]=j=0k1p[j]f[i1]j ,
f i ​ = p 0 ​ + p 1 ​ f i − 1 ​ + p 2 ​ ( f i − 1 ​ ) 2 + p 3 ​ ( f i − 1 ​ ) 3 + . . . + p n − 1 ​ ( f i − 1 ​ ) n − 1 f i ​ =p 0 ​ +p 1 ​ f i−1 ​ +p 2 ​ (f i−1 ​ ) 2 +p 3 ​ (f i−1 ​ ) 3 +...+p n−1 ​ (f i−1 ​ ) n−1 fi=p0+p1fi1+p2(fi1)2+p3(fi1)3+...+pn1(fi1)n1

其中 p j ( f i − 1 ) j p_j(f_i-1)^j pj(fi1)j的意思是,又生了j个麻球,这些麻球在i-1天后死亡。

由于一开始有k只麻球,且各麻球死亡是独立的,所以答案为 ( f m ) k (f_m)^k (fm)k

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const ll N=1e3+7;
const ll mod=1e9+7;
ll t,n,k,cnt,m;
double p[N];
double f[N];
int main()

    ios::sync_with_stdio(false);
    cin.tie(0),cout.tie(0);
    cin>>t;
    while(t--)
    
        memset(f,0,sizeof f);
        memset(p,0,sizeof p);
        cnt++;
        cin>>n>>k>>m;
        for(int i=0;i<n;i++)
            cin>>p[i];
        f[1]=p[0];
        for(int i=2;i<=m;++i)
            for(int j=0;j<n;++j)
                f[i]+=pow(f[i-1],j)*p[j];
        printf("Case #%lld: %.7lf\\n",cnt,pow(f[m],k));
    

2.算概率(简单,数论)

算概率

说明:有 1 道题,做对的概率是 1 2 1 \\over 2 21 在模 1 0 9 + 7 10^9+7 109+7意义下为 500000004 )。

f i , j f i,j fi,j表示前 i 道题做对 j道的概率转移时考虑第 j 道题是否做对,转移方程为:
f i , j = f i − 1 , j × ( 1 − p i ) + f i − 1 , j − 1 × p i f_i,j=f_i-1,j\\times (1-p_i)+f_i-1,j-1\\times p_i fi,j=fi1,j×(1pi)+fi1,j1×pi
时间复杂度 O ( n 2 )

以上是关于动态规划数学期望/概率DP/期望DP详解的主要内容,如果未能解决你的问题,请参考以下文章

期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解

期望DP概率与数学期望学习/思维方式分析/绿豆蛙的归宿详解

整理数学期望和概率DP

动态规划专题

概率dp 期望 逆推

POJ2096Collecting Bugs(数学期望,概率DP)