Jury Compromise---poj1015(动态规划,dp,)

Posted 西瓜不懂柠檬的酸

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Jury Compromise---poj1015(动态规划,dp,)相关的知识,希望对你有一定的参考价值。

题目链接:http://poj.org/problem?id=1015

 

大致题意:

在遥远的国家佛罗布尼亚,嫌犯是否有罪,须由陪审团决定。陪审团是由法官从公众中挑选的。先随机挑选n 个人作为陪审团的候选人,然后再从这n 个人中选m 人组成陪审团。选m 人的办法是:控方和辩方会根据对候选人的喜欢程度,给所有候选人打分,分值从0 到20。为了公平起见,法官选出陪审团的原则是:选出的m 个人,必须满足辩方总分D控方总分P的差的绝对值|D-P|最小。如果有多种选择方案的|D-P| 值相同,那么选辩控双方总分之和 D + P 最大的方案即可。

输出:

选取符合条件的最优m个候选人后,要求输出这m个人的辩方总值D和控方总值P,并升序输出他们的编号

 

 

 

为叙述问题方便,现将任一选择方案中,辩方总分和控方总分之差简称为“辩控差”,辩方总分和控方总分之和称为“辩控和”。第i 个候选人的辩方总分和控方总分之差记为V(i),辩方总分和控方总分之和记为S(i)。

现用dp(j, k)表示,取j 个候选人,使其辩控差为k 的所有方案中,辩控和最大的那个方案(该方案称为“方案dp(j, k)”)的辩控和。

并且,我们还规定,如果没法选j 个人,使其辩控差为k,那么dp(j, k)的值就为-1,也称方案dp(j, k)不可行。本题是要求选出m 个人,那么,如果对k 的所有可能的取值,求出了所有的dp(m, k) (-20×m≤ k ≤ 20×m),那么陪审团方案自然就很容易找到了。     问题的关键是建立递推关系。需要从哪些已知条件出发,才能求出dp(j, k)呢?显然,方案dp(j, k)是由某个可行的方案dp(j-1, x)( -20×m ≤ x ≤ 20×m)演化而来的。

可行方案dp(j-1, x)能演化成方案dp(j, k)的必要条件是:存在某个候选人i,i 在方案dp(j-1, x)中没有被选上,且x+V(i) = k。在所有满足该必要条件的dp(j-1, x)中,选出 dp(j-1, x) + S(i) 的值最大的那个,那么方案dp(j-1, x)再加上候选人i,就演变成了方案 dp(j, k)。

这中间需要将一个方案都选了哪些人都记录下来。不妨将方案dp(j, k)中最后选的那个候选人的编号,记在二维数组的元素path[j][k]中。那么方案dp(j, k)的倒数第二个人选的编号,就是path[j-1][k-V[path[j][k]]]。假定最后算出了解方案的辩控差是k,那么从path[m][k]出发,就能顺藤摸瓜一步步回溯求出所有被选中的候选人。

初始条件,只能确定dp(0, 0) = 0,其他均为-1。由此出发,一步步自底向上递推,就能求出所有的可行方案dp(m, k)( -20×m ≤ k ≤ 20×m)。实际解题的时候,会用一个二维数组dp 来存放dp(j, k)的值。而且,由于题目中辩控差的值k 可以为负数,而程序中数租下标不能为负数,所以,在程序中不妨将辩控差的值都加上修正值fix=400,以免下标为负数导致出错。

为什么base=400?这是很显然的,m上限为20人,当20人的d均为0,p均为20时,会出现辨控差为-400。修正后回避下标负数问题,区间整体平移,从[-400,400]映射到[0,800]。

此时初始条件修正为dp(0, base) = 0,其他均为-1。

DP后,从第m行的dp(m, base)开始往两边搜索最小|D-P| 即可,第一个不为dp[m][k]!=-1的位置k就是最小|D-P|的所在。

最后就是求m个人的D和P,由于D+P = dp(m, |D-P| ) ,|D-P|已知。

那么D= (D+P + |D-P| )/2  ,  P=(D+P-|D-P| ) / 2

计算D和P时注意修正值base

 

 

#include <cstdio>
#include <cstring>
#include <iostream>
#include <cmath>
#include <vector>
#include <algorithm>
#include <string>
using namespace std;

#define N 1100
#define MOD 1000000007
#define met(a, b) memset(a, b, sizeof(a))
#define INF 0x3f3f3f3f

typedef long long LL;

int dp[25][N], Ans[25], Path[25][N];
int n, m, Limit;

struct node
{
    int d, p, v, s;
}a[N];
///dp[j][k]表示选j个人的辨控差为k 的 最大辨控和
void DP()
{
    for(int j=0; j<=m; j++)///需要选出m人;
    {
        for(int k=0; k<=Limit*2; k++)///辨控差的范围是(a---Limit*2)
        {
            if(dp[j][k]==-1)continue;///保证下面的 k+a[i].v 不会出现负数;

            for(int i=1; i<=n; i++)///枚举人物;
            {
                if(dp[j+1][k+a[i].v] < dp[j][k] + a[i].s)
                {
                    int t1 = j, t2 = k;
                    while(t1>0 && Path[t1][t2] != i)///判断第i人有没有在前j个人中;
                    {
                        t2 -= a[Path[t1][t2]].v;
                        t1 --;
                    }
                    if(t1 == 0)///如果没有,那么更新dp和Path,把第i人加进去;
                    {
                        dp[j+1][k+a[i].v] = dp[j][k] + a[i].s;
                        Path[j+1][k+a[i].v] = i;
                    }
                }
            }
        }
    }
}

int main()
{
    int t = 1;
    while(scanf("%d %d", &n, &m), m+n)
    {
        met(dp, -1); met(a, 0);
        met(Ans, 0); met(Path, 0);

        for(int i=1; i<=n; i++)
        {
            scanf("%d %d", &a[i].p, &a[i].d);
            a[i].v = a[i].p - a[i].d;
            a[i].s = a[i].p + a[i].d;
        }
        Limit = m*20;
///所能达到的极端辨控差值,防止下标越界,所以都加上一个数,当辨控差的范围是-400-400,我们可以把它转化为0-800;

        dp[0][Limit] = 0;///只知道此状态是 0;

        DP();

///从小到大的寻找第一个能到达的辨控差,即为最小,然后找绝对值为它的对应的两个数,找到大的那个;记录相应的辨控差;
        int s = 0, Mid = Limit, k;
        while(dp[m][Mid+s]==-1 && dp[m][Mid-s]==-1) s++;

        if(dp[m][Mid+s] > dp[m][Mid-s]) k = Mid+s;
        else k = Mid-s;
///所能达到的极端辨控差值,防止下标越界,所以都加上一个数,当辨控差的范围是-400-400,我们可以把它转化为0-800;

        int p = m, sum1 = 0, sum2 = 0;
        for(int i=1; i<=m; i++)
        {
            Ans[i] = Path[p][k];

            sum1 += a[Ans[i]].p;
            sum2 += a[Ans[i]].d;

            p --;
            k -= a[Ans[i]].v;
        }

        printf("Jury #%d\\n", t++);
        printf("Best jury has value %d for prosecution and value %d for defence:\\n", sum1, sum2);

        sort(Ans+1, Ans+m+1);

        for(int i=1; i<=m; i++)
            printf(" %d", Ans[i]);
        printf("\\n\\n");
    }
    return 0;
}
View Code

 

以上是关于Jury Compromise---poj1015(动态规划,dp,)的主要内容,如果未能解决你的问题,请参考以下文章

背包DPJury Compromise POJ - 1015

[POJ1015] Jury Compromise 题解

POJ - 1015 Jury Compromise

poj1015 Jury Compromise

[kuangbin 基础dp][POJ 1015] Jury Compromise(dp)

[poj1015]Jury Compromise[DP]