数据机构与算法之深入解析“最小覆盖子串”的求解思路与算法示例

Posted Serendipity·y

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据机构与算法之深入解析“最小覆盖子串”的求解思路与算法示例相关的知识,希望对你有一定的参考价值。

一、题目要求

  • 给你一个字符串 s、一个字符串 t,返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 “”。
  • 注意:
    • 对于 t 中重复字符,寻找的子字符串中该字符数量必须不少于 t 中该字符数量。
    • 如果 s 中存在这样的子串,保证它是唯一的答案。
  • 示例 1:
输入:s = "ADOBECODEBANC", t = "ABC"
输出:"BANC"
  • 示例 2:
输入:s = "a", t = "a"
输出:"a"
  • 示例 3:
输入: s = "a", t = "aa"
输出: ""
解释: t 中两个字符 'a' 均应包含在 s 的子串中,
因此没有符合条件的子字符串,返回空字符串。
  • 提示:
    • 1 <= s.length, t.length <= 105
    • s 和 t 由英文字母组成。

二、求解算法

① 滑动窗口

  • 思路:
    • 用 i,j 表示滑动窗口的左边界和右边界,通过改变 i,j 来扩展和收缩滑动窗口,可以想象成一个窗口在字符串上游走;
    • 当这个窗口包含的元素满足条件,即包含字符串 T 的所有元素,记录下这个滑动窗口的长度 j-i+1,这些长度中的最小值就是要求的结果。
  • 步骤:
    • 不断增加 j 使滑动窗口增大,直到窗口包含了 T 的所有元素;
    • 不断增加 i 使滑动窗口缩小,因为是要求最小字串,所以将不必要的元素排除在外,使长度减小,直到碰到一个必须包含的元素,这个时候不能再扔,再扔就不满足条件,记录此时滑动窗口的长度,并保存最小值;
    • 让 i 再增加一个位置,这个时候滑动窗口肯定不满足条件,那么继续从步骤一开始执行,寻找新的满足条件的滑动窗口,如此反复,直到j超出了字符串 S 范围。
  • 如何判断滑动窗口包含了 T 的所有元素?
    • 用一个字典 need 来表示当前滑动窗口中需要的各元素的数量,一开始滑动窗口为空,用 T 中各元素来初始化这个 need,当滑动窗口扩展或者收缩的时候,去维护这个 need 字典,例如当滑动窗口包含某个元素,就让 need 中这个元素的数量减 1,代表所需元素减少了 1 个;当滑动窗口移除某个元素,就让 need 中这个元素的数量加 1。
    • 记住一点:need 始终记录着当前滑动窗口下,我们还需要的元素数量,在改变 i,j 时,需同步维护 need。
    • 值得注意的是,只要某个元素包含在滑动窗口中,就会在 need 中存储这个元素的数量,如果某个元素存储的是负数代表这个元素是多余的。比如当 need 等于‘A’:-2,‘C’:1时,表示当前滑动窗口中,有 2 个 A 是多余的,同时还需要 1 个 C。这么做的目的就是为了上面的第二个步骤中,排除不必要的元素,数量为负的就是不必要的元素,而数量为 0 表示刚刚好。
    • 回到问题中来,那么如何判断滑动窗口包含了 T 的所有元素?结论就是当 need 中所有元素的数量都小于等于 0 时,表示当前滑动窗口不再需要任何元素。
  • 优化:
    • 如果每次判断滑动窗口是否包含了 T 的所有元素,都去遍历 need 看是否所有元素数量都小于等于 0,这个会耗费 O(k) 的时间复杂度,k 代表字典长度,最坏情况下,k 可能等于 len(S);
    • 其实这个是可以避免的,可以维护一个额外的变量 needCnt 来记录所需元素的总数量,当碰到一个所需元素 c,不仅 need[c] 的数量减少 1,同时 needCnt 也要减少 1,这样通过 needCnt 就可以知道是否满足条件,而无需遍历字典了。
    • need 记录了遍历到的所有元素,而只有 need[c]>0 大于 0 时,代表 c 就是所需元素。
  • 以 S=“DOABECODEBANC”,T=“ABC” 为例:
    • 初始状态:

    • 不断增加 j 使滑动窗口增大,直到窗口包含了 T 的所有元素,need 中所有元素的数量都小于等于 0,同时 needCnt 也是 0:

    • 不断增加 i 使滑动窗口缩小,直到碰到一个必须包含的元素 A,此时记录长度更新结果:

    • 让 i 再增加一个位置,开始寻找下一个满足条件的滑动窗口:

  • Python 示例:
    def minWindow(self, s: str, t: str) -> str:
        need=collections.defaultdict(int)
        for c in t:
            need[c]+=1
        needCnt=len(t)
        i=0
        res=(0,float('inf'))
        for j,c in enumerate(s):
            if need[c]>0:
                needCnt-=1
            need[c]-=1
            if needCnt==0:       #步骤一:滑动窗口包含了所有T元素
                while True:      #步骤二:增加i,排除多余元素
                    c=s[i] 
                    if need[c]==0:
                        break
                    need[c]+=1
                    i+=1
                if j-i<res[1]-res[0]:   #记录结果
                    res=(i,j)
                need[s[i]]+=1  #步骤三:i增加一个位置,寻找新的满足条件滑动窗口
                needCnt+=1
                i+=1
        return '' if res[1]>len(s) else s[res[0]:res[1]+1]    #如果res始终没被更新过,代表无满足条件的结果
  • Java 示例:
class Solution 
    public String minWindow(String s, String t) 
        if (s == null || s.length() == 0 || t == null || t.length() == 0)
            return "";
        
        int[] need = new int[128];
        // 记录需要的字符的个数
        for (int i = 0; i < t.length(); i++) 
            need[t.charAt(i)]++;
        
        // l是当前左边界,r是当前右边界,size记录窗口大小,count是需求的字符个数,start是最小覆盖串开始的index
        int l = 0, r = 0, size = Integer.MAX_VALUE, count = t.length(), start = 0;
        // 遍历所有字符
        while (r < s.length()) 
            char c = s.charAt(r);
            if (need[c] > 0)  // 需要字符c
                count--;
            
            need[c]--; // 把右边的字符加入窗口
            if (count == 0)  // 窗口中已经包含所有字符
                while (l < r && need[s.charAt(l)] < 0) 
                    need[s.charAt(l)]++; // 释放右边移动出窗口的字符
                    l++; // 指针右移
                
                if (r - l + 1 < size)  // 不能右移时候挑战最小窗口大小,更新最小窗口开始的start
                    size = r - l + 1;
                    start = l; // 记录下最小值时候的开始位置,最后返回覆盖串时候会用到
                
                // l向右移动后窗口肯定不能满足了 重新开始循环
                need[s.charAt(l)]++;
                l++;
                count++;
            
            r++;
        
        return size == Integer.MAX_VALUE ? "" : s.substring(start, start + size);
    

以上是关于数据机构与算法之深入解析“最小覆盖子串”的求解思路与算法示例的主要内容,如果未能解决你的问题,请参考以下文章

数据机构与算法之深入解析“颜色分类”的求解思路与算法示例

数据机构与算法之深入解析“解码方法”的求解思路与算法示例

数据机构与算法之深入解析“柱状图中最大的矩形”的求解思路与算法示例

数据机构与算法之深入解析“完美矩形”的求解思路与算法示例

数据机构与算法之深入解析“复原IP地址”的求解思路与算法示例

双指针最小覆盖子串(滑动窗口)(medium)