LeetCode刷题 -- 97. 交错字符串

Posted DogTwo

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了LeetCode刷题 -- 97. 交错字符串相关的知识,希望对你有一定的参考价值。

  今天这道题是困难难度的,二狗很努力的尝试,还是失败了。但是感觉虽然没通过全部的测试用例,思考的过程还是有很多地方挺有趣的,记录一下。

 

97. 交错字符串

给定三个字符串 s1, s2, s3, 验证 s3 是否是由 s1 和 s2 交错组成的。

示例 1:

输入: s1 = "aabcc", s2 = "dbbca", s3 = "aadbbcbcac"
输出: true
示例 2:

输入: s1 = "aabcc", s2 = "dbbca", s3 = "aadbbbaccc"
输出: false

  先来看看我的想法以及做法吧:

  这道题目很值得纪念一下。对官方给出的解答十分佩服,另外虽然自己做的过程 99/101 没有完全通过,但是思考过程也觉得有很多可以留意的地方。

 


    初见这道题,两个字符串混合成第三个字符串。第一反应就是利用双指针,分别与第三个字符串进行比较.进一步思考发现也没有那么简单,比如遇到三个指针指向的字母现在是同一个的时候,比如都是\'a\'
  应该选择哪个呢?顺着这个思路联想到了 回溯算法 没关系,现在两条路看起来都是正确的,那么我就去尝试,如果失败了我就回溯到选择的地方,选择另一条路径继续进行尝试。
  除开简单的边界值考虑,上面这种双指针+回溯的算法其实很简单。需要考虑的就只有三种情况。

  1. s1,s2当前应该计算的字符与s3的应当计算的字符都不相等。 这种可以直接判断是不满足条件的,应当返回false.
  2. s1, s2与s3中当前对应应比较的字符有一个相等,这种其实只有一条路径,更新下次我们应该计算的索引即可。
  3.  s1,s2与s3中当前对应应比较的字符全部都相等,这种其实就对应我们的回溯,应该选择一条路去尝试,不行就尝试另一条。

  照着这个思路,前面的测试用例都通过了,直到遇到了测试用例99:
  s1 "bbbbbabbbbabaababaaaabbababbaaabbabbaaabaaaaababbbababbbbbabbbbababbabaabababbbaabababababbbaaababaa"
  s2 "babaaaabbababbbabbbbaabaabbaabbbbaabaaabaababaaaabaaabbaaabaaaabaabaabbbbbbbbbbbabaaabbababbabbabaab"
  s3 "babbbabbbaaabbababbbbababaabbabaabaaabbbbabbbaaabbbaaaaabbbbaabbaaabababbaaaaaabababbababaababbababbbababbbbaaaabaabbabbaaaaabbabbaaaabbbaabaaabaababaababbaaabbbbbabbbbaabbabaabbbbabaaabbababbabbabbab"

  像是为上面的方法量身定制的天敌一样,这组测试用例足够长,并且内容足够“简单”,只有a,b两个字符,因此按照上面的算法,遇到3的情况就会特别频繁。也就会花费大量的时间计算错误的路径,最后的结果当然是超时了。
  但我其实不是很愿意轻易就放弃写好的算法,打算优化一下。首先作为回溯算法来说,合理的剪枝可以减少不必要的计算。但观察题目,我也没有想到特别好的剪枝的办法,因为实在不容易根据已计算的字符判断后续哪条路径是不正确的。
  回忆起当初看的算法教程关于字符串匹配KMP算法的内容,其中一个核心思想是每次尽可能多的匹配字符。于是我也尝试这样做。
  对于上述的2的这种情况,比如s1的当前索引i1对应的字符与s3当前索引i3对应的字符相等,s2的索引i2对应的字符不相等,下次递归我就会计算 i1+1,i2,i3+1 这三个字符的关系。就从这里下手,这种情况下,我们可以多计算一些偏移量。
  具体来说就是如果i1+1,i2,i3+1仍满足这个条件,我们就继续向后偏移,直到不满足这种条件了我们才进行下一次的递归。结合代码如下:

if (ca1[i1] == ca3[i3] && ca2[i2] != ca3[i3])
{
    int offset = 0;

    while (i1 + offset < ca1.Count() && ca1[i1 + offset] == ca3[i3 + offset] && ca2[i2] != ca3[i3 + offset])
    {
        offset++;
    }

    if (ca2[i2] != ca3[i3 + offset])
        return false;

    return huisu(ca1, i1 + offset, ca2, i2, ca3, i3+ offset);
}        

 

  这样一番改造后自信满满的去测试,仍旧超时。其实分析一下就明白了,上面的优化主要集中在2的那种情况,而98更多的其实会命中3的那种情况。
  综上,完败,虽然有点不甘心,但还是服气的。完整代码在下面:

        public bool IsInterleave(string s1, string s2, string s3)
        {
            if (s1.Length + s2.Length != s3.Length)
            {
                return false;
            }

            if (string.IsNullOrEmpty(s1) || string.IsNullOrEmpty(s2))
            {
                return s1 + s2 == s3;
            }

            return huisu(s1.ToCharArray(), 0, s2.ToCharArray(), 0, s3.ToCharArray(), 0);
        }

        public bool huisu(char[] ca1, int i1, char[] ca2, int i2, char[] ca3, int i3)
        {
            if (i1 == ca1.Count() && i2 == ca2.Count() && i3 == ca3.Count())
            {
                return true;
            }

            if (i1 == ca1.Count())
            {
                for (int i = 0; i < ca3.Count() - i3 - 1; i++)
                {
                    if (ca2[i2 + i] != ca3[i3 + i])
                    {
                        return false;
                    }
                }

                return true;
            }

            if (i2 == ca2.Count())
            {
                for (int i = 0; i < ca3.Count() - i3 - 1; i++)
                {
                    if (ca1[i1 + i] != ca3[i3 + i])
                    {
                        return false;
                    }
                }

                return true;
            }

            if (ca1[i1] == ca3[i3] && ca2[i2] != ca3[i3])
            {
                int offset = 0;

                while (i1 + offset < ca1.Count() && ca1[i1 + offset] == ca3[i3 + offset] && ca2[i2] != ca3[i3 + offset])
                {
                    offset++;
                }

                if (ca2[i2] != ca3[i3 + offset])
                    return false;

                return huisu(ca1, i1 + offset, ca2, i2, ca3, i3 + offset);
            }
            else if (ca1[i1] != ca3[i3] && ca2[i2] == ca3[i3])
            {
                int offset = 0;

                while (i2 + offset < ca2.Count() && ca1[i1] != ca3[i3 + offset] && ca2[i2 + offset] == ca3[i3 + offset])
                {
                    offset++;
                }

                if (ca1[i1] != ca3[i3 + offset])
                    return false;

                return huisu(ca1, i1, ca2, i2 + offset, ca3, i3 + offset);
            }
            else if (ca1[i1] != ca3[i3] && ca2[i2] != ca3[i3])
            {
                return false;
            }
            else
            {
                return huisu(ca1, i1 + 1, ca2, i2, ca3, i3 + 1) || huisu(ca1, i1, ca2, i2 + 1, ca3, i3 + 1);
            }

        }

 

  

 下面是官方给出的动态规划的解法,让人眼前一亮。
  解题过程中也有想过是否可以使用动态规划的思路去做,但没想到一个合适的状态转移方程,就没有继续思考下去。
  来看看官方给出的状态转移的思路吧:传送门.
  简单来说:关键是要找到当前的状态和上一个状态的关系,在这道题目中是 如果当前s1或s2的字符与s3相等,如果满足条件,那么上一个字符比如按也是满足的.C#版代码如下:

        public bool IsInterleave(string s1, string s2, string s3)
        {
            if (s1.Length + s2.Length != s3.Length)
            {
                return false;
            }

            bool[,] dp = new bool[s1.Length + 1, s2.Length + 1];

            dp[0, 0] = true;

            for (int i = 0; i <= s1.Length; i++)
            {
                for (int j = 0; j <= s2.Length; j++)
                {
                    int p = i + j - 1;

                    if (i > 0)
                    {
                        dp[i, j] = dp[i, j] || (dp[i - 1, j] && s1[i - 1] == s3[p]);
                    }

                    if (j > 0)
                    {
                        dp[i, j] = dp[i, j] || (dp[i, j-1] && s2[j - 1] == s3[p]);
                    }
                }
            }

            return dp[s1.Length, s2.Length];
        }

 

  虽然自己写的很爽,但是估计没有人会看的吧,如果你看到这里了,二狗子在这儿先谢谢您哈,哈哈。

以上是关于LeetCode刷题 -- 97. 交错字符串的主要内容,如果未能解决你的问题,请参考以下文章

LeetCode 97. 交错字符串

LeetCode(97):交错字符串

[leetcode] 97. 交错字符串

Leetcode No.97 交错字符串

leetcode中等97交错字符串

leetcode中等97交错字符串