IDA*+剪枝DNA sequence

Posted streamazure

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了IDA*+剪枝DNA sequence相关的知识,希望对你有一定的参考价值。

DNA sequence HDU - 1560

题意:

给定N个DNA序列(仅由ATCG构成),求能使得这N个序列均为其子序列的最短公共序列,输出这个最小的长度。

思路:

IDA*,估价函数即N个序列中未匹配个数的最大值。(因为最理想情况是,当前所尝试的字母X加入公共序列之后,能同时与这N个序列匹配)

反思:

先前不知道IDA*,当作普通剪枝做了,发现T了之后又尝试按字母贡献值从大到小来搜索,但并没有多大的优化,还是T。

思路太直了,虽然意识到了“该序列未匹配的个数”的重要性,但还是大费周章地试图给每个序列每个字母的匹配情况做标记,也导致我在如何做标记、擦标记的问题上花了不少时间……

以后想问题还是得有意识地抓住最关键的变量,不能局限在“好想”和“直观”上。

int n;
int mshort = -1;
string alpha = "ATCG";

struct node {
    string ch;
    int len;
    int filled;
}DNA[10];

int guess() {
    int tmp = 0;
    for (int i = 1; i <= n; i++) {
        tmp = max(tmp, DNA[i].len - DNA[i].filled);
    }
    return tmp;
}

int dfs(int len,string s) {
    //估价函数,估计还要填几个字母,依据是所有序列中单个序列未做标记的个数的最大值
    if (len + guess() > mshort) return 0;
    //如果不行,限制逐渐放宽
    if (!guess()) return 1;

    int flag = 0, tem[10];
    for (int i = 0; i < 4; i++) {
        //遍历四个字母
        flag = 0;
        for (int j = 1; j <= n; j++)
            tem[j] = DNA[j].filled;
        //匹配之前临时存一下已匹配个数,便于后续还原
        for (int j = 1; j <= n; j++) {
            if (DNA[j].filled<DNA[j].len && DNA[j].ch[DNA[j].filled] == alpha[i]) {
                DNA[j].filled++;
                flag = 1;
                //标记 这个字母有贡献
            }
        }
        if (flag) {
            if (dfs(len + 1,s+alpha[i])) return 1;
            for (int k = 1; k <= n; k++) DNA[k].filled = tem[k];
            //还原
        }
    }
    return 0;
}

int main()
{
    ios::sync_with_stdio(false);
    int t; cin >> t; while (t--) {
        cin >> n;
        mshort = -1;
        for (int i = 1; i <= n; i++) {
            cin >> DNA[i].ch;
            DNA[i].len = DNA[i].ch.length();
            DNA[i].filled = 0;
            mshort = max(mshort, DNA[i].len);
        }
        //迭代加深
        while (!dfs(0,"")) {
            mshort++;
        }
        cout << mshort << endl;
    }
    return 0;
}

以上是关于IDA*+剪枝DNA sequence的主要内容,如果未能解决你的问题,请参考以下文章

POJ2778DNA Sequence(AC自动机)

POJ1699 Best Sequence(AC自动机+状压DP)

骑士精神——IDA*

LeetCode-187. Repeated DNA Sequences

187 Repeated DNA Sequences 重复的DNA序列

习题:DNA Sequence(AC自动机)