POJ 2096 概率DP
Posted 文竹balala
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了POJ 2096 概率DP相关的知识,希望对你有一定的参考价值。
题意:一个软件有s个子系统,n种bug,一个人每天可以发现一个bug
求发现n种bug且每个子系统至少有一个bug的期望(也就是平均天数)
分析:
这是我的第一道概率DP问题,看了网上题解后才会做,这里使用逆着递推
我感觉顺着递推应该也能做,但是没有尝试。
dp[i][j]表示已经找到i种bug,j个系统的bug,达到目标状态的天数的期望
dp[n][s]=0;要求的答案是dp[0][0];
dp[i][j]可以转化成以下四种状态:
dp[i][j],发现一个bug属于已经有的i个分类和j个系统。
概率为p1 = (i/n)*(j/s);
dp[i][j+1],发现一个bug属于已有的分类,不属于已有的系统.
概率为 p2 = (i/n)*(1-j/s);
dp[i+1][j],发现一个bug不属于已有的分类,属于已有的系统,
概率为 p3 = (1-i/n)*(j/s);
dp[i+1][j+1],发现一个bug不属于已有的系统,不属于已有的分类,
概率为 p4 = (1-i/n)*(1-j/s);
整理便得到转移方程dp[i][j] = p1*dp[i][j]+p2*dp[i][j+1]+p3*dp[i+1][j]+p4*dp[i+1][j+1] + 1;
为什么要这样写,我看了网上写的题解想了好久...
首先由于期望具有线性,两个不想关的随机变量可以相加即
E(aA+bB+cC+...) = aEA+bEB+cEC+... a,b,c,d...表示概率,A,B,C...表示状态
所以本题开始我一直不理解为什么是dp[i][j]推出另外四种状态但是却是另外四种乘上概率
然后我又不理解为什么后边会加上1,我找到的题解中都没有说为什么要加
我自己得理解是经过了一天状态才能从dp[i][j]到另外四种状态,所以逆推过来,
dp[i][j]要比另外四种状态理论上多一天。
最后就是注意G++最后输出要用%.4f,因为这个WA了好多发,第一次被这样坑。。
#include <stdio.h>
#include <string.h>
#include <algorithm>
#include <iostream>
using namespace std;
const int maxn = 1000 + 5;
double f[maxn][maxn];
int main()
int n, s;
while(cin >> n >> s)
memset(f, 0, sizeof(f));
f[n][s] = 0.0;
for (int i = n; i >= 0; i--)
for (int j = s; j >= 0; j--)
double p1 = (n-i)*j*1.0;
double p2 = i*(s-j)*1.0;
double p3 = (n-i)*(s-j)*1.0;
double p4 = n*s - i*j*1.0;
if (i == n && j == s)continue;
f[i][j] = 1.0*(p1*f[i+1][j]+p2*f[i][j+1]+p3*f[i+1][j+1]+n*s)/p4;
printf("%.4lf\\n", f[0][0]);//注意poj上G++要用%.4f
return 0;
以上是关于POJ 2096 概率DP的主要内容,如果未能解决你的问题,请参考以下文章
POJ - 2096 Collecting Bugs(概率dp)