力扣：串联所有单词的子串（滑动窗口+哈希）

Posted 2023-04-11 大便上的牙印

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了力扣：串联所有单词的子串（滑动窗口+哈希）相关的知识，希望对你有一定的参考价值。

首先，用 $\\rm n$ 表示 $\\rm S$ 串的长度，用 $\\rm m$ 表示 $\\rm words$ 的长度即words中单词的数量，用 $\\rm w$ 表示 $\\rm words$ 中每个单词的长度。
①对于 $\\rm S$ 串以 $\\rm w$ 为长度进行分割，则每一个 $\\rm w$ 独立存在（可看成一个元素）。

②则有以 $0,1,\\dots,w-1$ 的 $\\rm w$ 起点，看作 $\\rm w$ 个组。
③在该串上，对每一个长度为 $\\rm w$ 看作独立存在的元素，维护一个长度为 $\\rm m$ 的滑动窗口， $\\rm j$ 作为滑动窗口的结尾，用来维护长度。

④设 $\\rm map$ 类型的 $\\rm tot$ ，用来维护 $w or d s$ 里面的单词所对应的数量。
在每一个组中，设 $\\rm map$ 类型的 $\\rm wd$ ，用来维护窗口内每个单词所对应的数量。
$\\rm cnt$ 表示两个集合中同时存在的单词的数量
时间复杂度：
对每个视作独立元素做滑动窗口， $\\rm \\fracnw$ 次滑动窗口移动,每次移动加一个元素，减一个元素，一共有 $\\rm w$ 组，时间复杂度为 $O (n)$ .

c++:

class Solution 
public:
    vector<int> findSubstring(string s, vector<string>& words) 
        vector<int> res;
        if(words.empty()) return res;
        int n = s.size(),m = words.size(),w = words[0].size();
        unordered_map<string,int> tot;
        for(auto& word : words) tot[word] ++;

        for(int i = 0;i < w;i++)
        
            int cnt = 0;
            unordered_map<string,int> wd;
            for(int j = i;j + w <= n;j += w)
            
                if(j >= i + m * w)//若超出滑动窗口的长度，则将以j结尾的窗口的前一个单词排出
                
                    auto word = s.substr(j - m * w,w);
                    wd[word]--;
                    //剔除的该单词在滑动窗口集合的数量小于words里面单词的数量，说明匹配的数量减少了
                    if(wd[word] < tot[word]) cnt--;
                
                auto word = s.substr(j,w);
                wd[word]++;
                //增加的单词在滑动窗口集合的数量增加之后依然没有超过words里单词的数量，说明满足条件的匹配的数量增加了
                if(wd[word] <= tot[word]) cnt++;
                if(cnt == m) res.push_back(j - (m - 1) * w);//当相应单词匹配的数量为m时，即匹配了words里所有的单词，则将滑动窗口起点加入答案。
            
        
        return res;
    
;

算法leetcode｜30. 串联所有单词的子串（rust重拳出击）

30. 串联所有单词的子串：

给定一个字符串 s 和一个字符串数组 words。 words 中所有字符串 长度相同。

s 中的 串联子串 是指一个包含 words 中所有字符串以任意顺序排列连接起来的子串。

例如，如果 words = ["ab","cd","ef"]，那么 "abcdef"， "abefcd"，"cdabef"， "cdefab"，"efabcd"，和 "efcdab" 都是串联子串。 "acdbef" 不是串联子串，因为他不是任何 words 排列的连接。

返回所有串联字串在 s 中的开始索引。你可以以 任意顺序 返回答案。

样例 1：

输入：
	s = "barfoothefoobarman", words = ["foo","bar"]
	
输出：
	[0,9]
	
解释：
	因为 words.length == 2 同时 words[i].length == 3，连接的子字符串的长度必须为 6。
	子串 "barfoo" 开始位置是 0。它是 words 中以 ["bar","foo"] 顺序排列的连接。
	子串 "foobar" 开始位置是 9。它是 words 中以 ["foo","bar"] 顺序排列的连接。
	输出顺序无关紧要。返回 [9,0] 也是可以的。

样例 2：

输入：
	s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
	
输出：
	[]
	
解释：
	因为 words.length == 4 并且 words[i].length == 4，所以串联子串的长度必须为 16。
	s 中没有子串长度为 16 并且等于 words 的任何顺序排列的连接。
	所以我们返回一个空数组。

样例 3：

输入：
	s = "barfoofoobarthefoobarman", words = ["bar","foo","the"]

输出：
	[6,9,12]
	
解释：
	因为 words.length == 3 并且 words[i].length == 3，所以串联子串的长度必须为 9。
	子串 "foobarthe" 开始位置是 6。它是 words 中以 ["foo","bar","the"] 顺序排列的连接。
	子串 "barthefoo" 开始位置是 9。它是 words 中以 ["bar","the","foo"] 顺序排列的连接。
	子串 "thefoobar" 开始位置是 12。它是 words 中以 ["the","foo","bar"] 顺序排列的连接。

提示：

1 <= s.length <= 10⁴
1 <= words.length <= 5000
1 <= words[i].length <= 30
words[i] 和 s 由小写英文字母组成

分析：

面对这道算法题目，二当家的陷入了沉思。
由于题干里罗列了所有单词可能的串联出的子串，所以可能理所当然的考虑罗列所有子串，然后再去字符串中查看是否存在，但是这样太慢了，肯定是不对的。
由于题干中说所有字符串 长度相同，考虑用单词计数，滑动窗口解决。
需要注意的一些点是，首先窗口滑动的大小应该是单词的长度才对，另外，由于窗口的大小是单词的长度，那么起始下标就需要考虑偏移。

题解：

rust

impl Solution 
    pub fn find_substring(s: String, words: Vec<String>) -> Vec<i32> 
        let mut ans = Vec::new();
        let (m, n, ls) = (words.len(), words[0].len(), s.len());
        for i in 0..n 
            if i + m * n > ls 
                break;
            
            let mut differ = std::collections::HashMap::new();
            for j in 0..m 
                let word = &s[i + j * n..i + (j + 1) * n];
                *differ.entry(word).or_insert(0) += 1;
            
            for word in words.iter() 
                let count = differ.entry(word).or_insert(0);
                if *count == 1 
                    differ.remove(word as &str);
                 else 
                    *count -= 1;
                
            
            for start in (i..ls - m * n + 1).step_by(n) 
                if start != i 
                    let mut word = &s[start + (m - 1) * n..start + m * n];
                    let mut count = differ.entry(word).or_insert(0);
                    if *count == -1 
                        differ.remove(word);
                     else 
                        *count += 1;
                    
                    word = &s[start - n..start];
                    count = differ.entry(word).or_insert(0);
                    if *count == 1 
                        differ.remove(word);
                     else 
                        *count -= 1;
                    
                
                if differ.is_empty() 
                    ans.push(start as i32);
                
            
        
        return ans;

go

func findSubstring(s string, words []string) (ans []int) 
    m, n, ls := len(words), len(words[0]), len(s)
	for i := 0; i < n && i+m*n <= ls; i++ 
		differ := map[string]int
		for j := 0; j < m; j++ 
			differ[s[i+j*n:i+(j+1)*n]]++
		
		for _, word := range words 
			if differ[word] == 1 
				delete(differ, word)
			 else 
				differ[word]--
			
		
		for start := i; start < ls-m*n+1; start += n 
			if start != i 
				word := s[start+(m-1)*n : start+m*n]
				if differ[word] == -1 
					delete(differ, word)
				 else 
					differ[word]++
				
				word = s[start-n : start]
				if differ[word] == 1 
					delete(differ, word)
				 else 
					differ[word]--
				
			
			if len(differ) == 0 
				ans = append(ans, start)
			
		
	
	return

c++

class Solution 
public:
    vector<int> findSubstring(string s, vector<string>& words) 
        vector<int> ans;
        int m = words.size(), n = words[0].size(), ls = s.size();
        for (int i = 0; i < n && i + m * n <= ls; ++i) 
            unordered_map<string, int> differ;
            for (int j = 0; j < m; ++j) 
                ++differ[s.substr(i + j * n, n)];
            
            for (string &word: words) 
                if (--differ[word] == 0) 
                    differ.erase(word);
                
            
            for (int start = i; start < ls - m * n + 1; start += n) 
                if (start != i) 
                    string word = s.substr(start + (m - 1) * n, n);
                    if (++differ[word] == 0) 
                        differ.erase(word);
                    
                    word = s.substr(start - n, n);
                    if (--differ[word] == 0) 
                        differ.erase(word);
                    
                
                if (differ.empty()) 
                    ans.emplace_back(start);
                
            
        
        return ans;
    
;

python

class Solution:
    def findSubstring(self, s: str, words: List[str]) -> List[int]:
        ans = []
        m, n, ls = len(words), len(words[0]), len(s)
        for i in range(n):
            if i + m * n > ls:
                break
            differ = Counter()
            for j in range(m):
                word = s[i + j * n: i + (j + 1) * n]
                differ[word] += 1
            for word in words:
                if differ[word] == 1:
                    del differ[word]
                else:
                    differ[word] -= 1
            for start in range(i, ls - m * n + 1, n):
                if start != i:
                    word = s[start + (m - 1) * n: start + m * n]
                    if differ[word] == -1:
                        del differ[word]
                    else:
                        differ[word] += 1
                    word = s[start - n: start]
                    if differ[word] == 1:
                        del differ[word]
                    else:
                        differ[word] -= 1
                if len(differ) == 0:
                    ans.append(start)
        return ans

java

class Solution 
    public List<Integer> findSubstring(String s, String[] words) 
        List<Integer> ans = new ArrayList<Integer>();
        int           m   = words.length, n = words[0].length(), ls = s.length();
        for (int i = 0; i < n && i + m * n <= ls; ++i) 
            Map<String, Integer> differ = new HashMap<String, Integer>();
            for (int j = 0; j < m; ++j) 
                String word = s.substring(i + j * n, i + (j + 1) * n);
                differ.put(word, differ.getOrDefault(word, 0) + 1);
            
            for (String word : words) 
                differ.put(word, differ.getOrDefault(word, 0) - 1);
                if (differ.get(word) == 0) 
                    differ.remove(word);
                
            
            for (int start = i; start < ls - m * n + 1; start += n) 
                if (start != i) 
                    String word = s.substring(start + (m - 1) * n, start + m * n);
                    differ.put(word, differ.getOrDefault(word, 0) + 1);
                    if (differ.get(word) == 0) 
                        differ.remove(word);
                    
                    word = s.substring(start - n, start);
                    differ.put(word, differ.getOrDefault(word, 0) - 1);
                    if (differ.get(word) == 0) 
                        differ.remove(word);
                    
                
                if (differ.isEmpty()) 
                    ans.add(start);
                
            
        
        return ans;

非常感谢你阅读本文~
欢迎【点赞】【收藏】【评论】~
放弃不难，但坚持一定很酷~
希望我们大家都能每天进步一点点~
本文由二当家的白帽子：https://le-yi.blog.csdn.net/ 博客原创~

以上是关于力扣：串联所有单词的子串（滑动窗口+哈希）的主要内容，如果未能解决你的问题，请参考以下文章