Jury Compromise---poj1015(动态规划,dp,)

Posted 2020-07-04 西瓜不懂柠檬的酸

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Jury Compromise---poj1015(动态规划,dp,)相关的知识，希望对你有一定的参考价值。

大致题意：

在遥远的国家佛罗布尼亚，嫌犯是否有罪，须由陪审团决定。陪审团是由法官从公众中挑选的。先随机挑选n 个人作为陪审团的候选人，然后再从这n 个人中选m 人组成陪审团。选m 人的办法是：控方和辩方会根据对候选人的喜欢程度，给所有候选人打分，分值从0 到20。为了公平起见，法官选出陪审团的原则是：选出的m 个人，必须满足辩方总分D和控方总分P的差的绝对值|D-P|最小。如果有多种选择方案的|D-P| 值相同，那么选辩控双方总分之和 D + P 最大的方案即可。

输出：

选取符合条件的最优m个候选人后，要求输出这m个人的辩方总值D和控方总值P，并升序输出他们的编号。

为叙述问题方便，现将任一选择方案中，辩方总分和控方总分之差简称为“辩控差”，辩方总分和控方总分之和称为“辩控和”。第i 个候选人的辩方总分和控方总分之差记为V(i)，辩方总分和控方总分之和记为S(i)。

现用dp(j, k)表示，取j 个候选人，使其辩控差为k 的所有方案中，辩控和最大的那个方案（该方案称为“方案dp(j, k)”）的辩控和。

并且，我们还规定，如果没法选j 个人，使其辩控差为k，那么dp(j, k)的值就为-1，也称方案dp(j, k)不可行。本题是要求选出m 个人，那么，如果对k 的所有可能的取值，求出了所有的dp(m, k) (-20×m≤ k ≤ 20×m)，那么陪审团方案自然就很容易找到了。问题的关键是建立递推关系。需要从哪些已知条件出发，才能求出dp(j, k)呢？显然，方案dp(j, k)是由某个可行的方案dp(j-1, x)( -20×m ≤ x ≤ 20×m)演化而来的。

可行方案dp(j-1, x)能演化成方案dp(j, k)的必要条件是：存在某个候选人i，i 在方案dp(j-1, x)中没有被选上，且x+V(i) = k。在所有满足该必要条件的dp(j-1, x)中，选出 dp(j-1, x) + S(i) 的值最大的那个，那么方案dp(j-1, x)再加上候选人i，就演变成了方案 dp(j, k)。

这中间需要将一个方案都选了哪些人都记录下来。不妨将方案dp(j, k)中最后选的那个候选人的编号，记在二维数组的元素path[j][k]中。那么方案dp(j, k)的倒数第二个人选的编号，就是path[j-1][k-V[path[j][k]]]。假定最后算出了解方案的辩控差是k，那么从path[m][k]出发，就能顺藤摸瓜一步步回溯求出所有被选中的候选人。

初始条件，只能确定dp(0, 0) = 0，其他均为-1。由此出发，一步步自底向上递推，就能求出所有的可行方案dp(m, k)( -20×m ≤ k ≤ 20×m)。实际解题的时候，会用一个二维数组dp 来存放dp(j, k)的值。而且，由于题目中辩控差的值k 可以为负数，而程序中数租下标不能为负数，所以，在程序中不妨将辩控差的值都加上修正值fix=400，以免下标为负数导致出错。

为什么base=400？这是很显然的，m上限为20人，当20人的d均为0，p均为20时，会出现辨控差为-400。修正后回避下标负数问题，区间整体平移，从[-400,400]映射到[0,800]。

此时初始条件修正为dp(0, base) = 0，其他均为-1。

DP后，从第m行的dp(m, base)开始往两边搜索最小|D-P| 即可，第一个不为dp[m][k]!=-1的位置k就是最小|D-P|的所在。

最后就是求m个人的D和P，由于D+P = dp(m, |D-P| ) ，|D-P|已知。

那么D= (D+P + |D-P| )/2 , P=(D+P-|D-P| ) / 2

计算D和P时注意修正值base

#include <cstdio>
#include <cstring>
#include <iostream>
#include <cmath>
#include <vector>
#include <algorithm>
#include <string>
using namespace std;

#define N 1100
#define MOD 1000000007
#define met(a, b) memset(a, b, sizeof(a))
#define INF 0x3f3f3f3f

typedef long long LL;

int dp[25][N], Ans[25], Path[25][N];
int n, m, Limit;

struct node
{
    int d, p, v, s;
}a[N];
///dp[j][k]表示选j个人的辨控差为k 的 最大辨控和
void DP()
{
    for(int j=0; j<=m; j++)///需要选出m人；
    {
        for(int k=0; k<=Limit*2; k++)///辨控差的范围是（a---Limit*2）
        {
            if(dp[j][k]==-1)continue;///保证下面的 k+a[i].v 不会出现负数；

            for(int i=1; i<=n; i++)///枚举人物；
            {
                if(dp[j+1][k+a[i].v] < dp[j][k] + a[i].s)
                {
                    int t1 = j, t2 = k;
                    while(t1>0 && Path[t1][t2] != i)///判断第i人有没有在前j个人中；
                    {
                        t2 -= a[Path[t1][t2]].v;
                        t1 --;
                    }
                    if(t1 == 0)///如果没有，那么更新dp和Path，把第i人加进去；
                    {
                        dp[j+1][k+a[i].v] = dp[j][k] + a[i].s;
                        Path[j+1][k+a[i].v] = i;
                    }
                }
            }
        }
    }
}

int main()
{
    int t = 1;
    while(scanf("%d %d", &n, &m), m+n)
    {
        met(dp, -1); met(a, 0);
        met(Ans, 0); met(Path, 0);

        for(int i=1; i<=n; i++)
        {
            scanf("%d %d", &a[i].p, &a[i].d);
            a[i].v = a[i].p - a[i].d;
            a[i].s = a[i].p + a[i].d;
        }
        Limit = m*20;
///所能达到的极端辨控差值，防止下标越界，所以都加上一个数，当辨控差的范围是-400-400，我们可以把它转化为0-800；

        dp[0][Limit] = 0;///只知道此状态是 0；

        DP();

///从小到大的寻找第一个能到达的辨控差，即为最小，然后找绝对值为它的对应的两个数，找到大的那个；记录相应的辨控差；
        int s = 0, Mid = Limit, k;
        while(dp[m][Mid+s]==-1 && dp[m][Mid-s]==-1) s++;

        if(dp[m][Mid+s] > dp[m][Mid-s]) k = Mid+s;
        else k = Mid-s;
///所能达到的极端辨控差值，防止下标越界，所以都加上一个数，当辨控差的范围是-400-400，我们可以把它转化为0-800；

        int p = m, sum1 = 0, sum2 = 0;
        for(int i=1; i<=m; i++)
        {
            Ans[i] = Path[p][k];

            sum1 += a[Ans[i]].p;
            sum2 += a[Ans[i]].d;

            p --;
            k -= a[Ans[i]].v;
        }

        printf("Jury #%d\\n", t++);
        printf("Best jury has value %d for prosecution and value %d for defence:\\n", sum1, sum2);

        sort(Ans+1, Ans+m+1);

        for(int i=1; i<=m; i++)
            printf(" %d", Ans[i]);
        printf("\\n\\n");
    }
    return 0;
}

View Code

以上是关于Jury Compromise---poj1015(动态规划,dp,)的主要内容，如果未能解决你的问题，请参考以下文章

背包DPJury Compromise POJ - 1015

[POJ1015] Jury Compromise 题解

POJ - 1015 Jury Compromise

poj1015 Jury Compromise

[kuangbin 基础dp][POJ 1015] Jury Compromise（dp）

[poj1015]Jury Compromise[DP]