Jury Compromise---poj1015(动态规划,dp,)
Posted 西瓜不懂柠檬的酸
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Jury Compromise---poj1015(动态规划,dp,)相关的知识,希望对你有一定的参考价值。
题目链接:http://poj.org/problem?id=1015
大致题意:
在遥远的国家佛罗布尼亚,嫌犯是否有罪,须由陪审团决定。陪审团是由法官从公众中挑选的。先随机挑选n 个人作为陪审团的候选人,然后再从这n 个人中选m 人组成陪审团。选m 人的办法是:控方和辩方会根据对候选人的喜欢程度,给所有候选人打分,分值从0 到20。为了公平起见,法官选出陪审团的原则是:选出的m 个人,必须满足辩方总分D和控方总分P的差的绝对值|D-P|最小。如果有多种选择方案的|D-P| 值相同,那么选辩控双方总分之和 D + P 最大的方案即可。
输出:
选取符合条件的最优m个候选人后,要求输出这m个人的辩方总值D和控方总值P,并升序输出他们的编号。
为叙述问题方便,现将任一选择方案中,辩方总分和控方总分之差简称为“辩控差”,辩方总分和控方总分之和称为“辩控和”。第i 个候选人的辩方总分和控方总分之差记为V(i),辩方总分和控方总分之和记为S(i)。
现用dp(j, k)表示,取j 个候选人,使其辩控差为k 的所有方案中,辩控和最大的那个方案(该方案称为“方案dp(j, k)”)的辩控和。
并且,我们还规定,如果没法选j 个人,使其辩控差为k,那么dp(j, k)的值就为-1,也称方案dp(j, k)不可行。本题是要求选出m 个人,那么,如果对k 的所有可能的取值,求出了所有的dp(m, k) (-20×m≤ k ≤ 20×m),那么陪审团方案自然就很容易找到了。 问题的关键是建立递推关系。需要从哪些已知条件出发,才能求出dp(j, k)呢?显然,方案dp(j, k)是由某个可行的方案dp(j-1, x)( -20×m ≤ x ≤ 20×m)演化而来的。
可行方案dp(j-1, x)能演化成方案dp(j, k)的必要条件是:存在某个候选人i,i 在方案dp(j-1, x)中没有被选上,且x+V(i) = k。在所有满足该必要条件的dp(j-1, x)中,选出 dp(j-1, x) + S(i) 的值最大的那个,那么方案dp(j-1, x)再加上候选人i,就演变成了方案 dp(j, k)。
这中间需要将一个方案都选了哪些人都记录下来。不妨将方案dp(j, k)中最后选的那个候选人的编号,记在二维数组的元素path[j][k]中。那么方案dp(j, k)的倒数第二个人选的编号,就是path[j-1][k-V[path[j][k]]]。假定最后算出了解方案的辩控差是k,那么从path[m][k]出发,就能顺藤摸瓜一步步回溯求出所有被选中的候选人。
初始条件,只能确定dp(0, 0) = 0,其他均为-1。由此出发,一步步自底向上递推,就能求出所有的可行方案dp(m, k)( -20×m ≤ k ≤ 20×m)。实际解题的时候,会用一个二维数组dp 来存放dp(j, k)的值。而且,由于题目中辩控差的值k 可以为负数,而程序中数租下标不能为负数,所以,在程序中不妨将辩控差的值都加上修正值fix=400,以免下标为负数导致出错。
为什么base=400?这是很显然的,m上限为20人,当20人的d均为0,p均为20时,会出现辨控差为-400。修正后回避下标负数问题,区间整体平移,从[-400,400]映射到[0,800]。
此时初始条件修正为dp(0, base) = 0,其他均为-1。
DP后,从第m行的dp(m, base)开始往两边搜索最小|D-P| 即可,第一个不为dp[m][k]!=-1的位置k就是最小|D-P|的所在。
最后就是求m个人的D和P,由于D+P = dp(m, |D-P| ) ,|D-P|已知。
那么D= (D+P + |D-P| )/2 , P=(D+P-|D-P| ) / 2
计算D和P时注意修正值base
#include <cstdio> #include <cstring> #include <iostream> #include <cmath> #include <vector> #include <algorithm> #include <string> using namespace std; #define N 1100 #define MOD 1000000007 #define met(a, b) memset(a, b, sizeof(a)) #define INF 0x3f3f3f3f typedef long long LL; int dp[25][N], Ans[25], Path[25][N]; int n, m, Limit; struct node { int d, p, v, s; }a[N]; ///dp[j][k]表示选j个人的辨控差为k 的 最大辨控和 void DP() { for(int j=0; j<=m; j++)///需要选出m人; { for(int k=0; k<=Limit*2; k++)///辨控差的范围是(a---Limit*2) { if(dp[j][k]==-1)continue;///保证下面的 k+a[i].v 不会出现负数; for(int i=1; i<=n; i++)///枚举人物; { if(dp[j+1][k+a[i].v] < dp[j][k] + a[i].s) { int t1 = j, t2 = k; while(t1>0 && Path[t1][t2] != i)///判断第i人有没有在前j个人中; { t2 -= a[Path[t1][t2]].v; t1 --; } if(t1 == 0)///如果没有,那么更新dp和Path,把第i人加进去; { dp[j+1][k+a[i].v] = dp[j][k] + a[i].s; Path[j+1][k+a[i].v] = i; } } } } } } int main() { int t = 1; while(scanf("%d %d", &n, &m), m+n) { met(dp, -1); met(a, 0); met(Ans, 0); met(Path, 0); for(int i=1; i<=n; i++) { scanf("%d %d", &a[i].p, &a[i].d); a[i].v = a[i].p - a[i].d; a[i].s = a[i].p + a[i].d; } Limit = m*20; ///所能达到的极端辨控差值,防止下标越界,所以都加上一个数,当辨控差的范围是-400-400,我们可以把它转化为0-800; dp[0][Limit] = 0;///只知道此状态是 0; DP(); ///从小到大的寻找第一个能到达的辨控差,即为最小,然后找绝对值为它的对应的两个数,找到大的那个;记录相应的辨控差; int s = 0, Mid = Limit, k; while(dp[m][Mid+s]==-1 && dp[m][Mid-s]==-1) s++; if(dp[m][Mid+s] > dp[m][Mid-s]) k = Mid+s; else k = Mid-s; ///所能达到的极端辨控差值,防止下标越界,所以都加上一个数,当辨控差的范围是-400-400,我们可以把它转化为0-800; int p = m, sum1 = 0, sum2 = 0; for(int i=1; i<=m; i++) { Ans[i] = Path[p][k]; sum1 += a[Ans[i]].p; sum2 += a[Ans[i]].d; p --; k -= a[Ans[i]].v; } printf("Jury #%d\\n", t++); printf("Best jury has value %d for prosecution and value %d for defence:\\n", sum1, sum2); sort(Ans+1, Ans+m+1); for(int i=1; i<=m; i++) printf(" %d", Ans[i]); printf("\\n\\n"); } return 0; }
以上是关于Jury Compromise---poj1015(动态规划,dp,)的主要内容,如果未能解决你的问题,请参考以下文章
背包DPJury Compromise POJ - 1015