面试题19:正则表达式匹配(C++)
Posted wzw0625
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了面试题19:正则表达式匹配(C++)相关的知识,希望对你有一定的参考价值。
题目地址:https://leetcode-cn.com/problems/zheng-ze-biao-da-shi-pi-pei-lcof/
题目描述
请实现一个函数用来匹配包含‘. ‘和‘*‘的正则表达式。模式中的字符‘.‘表示任意一个字符,而‘*‘表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但与"aa.a"和"ab*a"均不匹配。
题目示例
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 ‘*‘ 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 ‘a‘。因此,字符串 "aa" 可被视为 ‘a‘ 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个(‘*‘)任意字符(‘.‘)。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 ‘*‘ 表示零个或多个,这里 ‘c‘ 为 0 个, ‘a‘ 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
注意
s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母以及字符 . 和 *,无连续的 ‘*‘。
解题思路
递归:分析题目,首先判断字符串p是否是空串,若p是空串,返回s是否是空串。若p不是空串,必存在p[1](可能是字符 ),即字符*出现的位置。解题的核心思路是对“x * ”的情况判断,当连x都匹配不了的话,那么直接将整个x*丢弃掉,如果能够匹配上x时,则保留x*。举例来说,s = "aab",p = "c*a*b",遇到c*,查看s中s[1]是否能够匹配字符c,我们发现无法匹配,所以,直接将整个c*丢掉,剩下p=a*b,继续判断s中的字符是否匹配a,我们发现匹配,所以,保留a*,其中*表示字符a可以出现任意次包括0次,当*表示匹配0个它紧邻的前面的字符时,直接忽略掉c*,比较aab和a*b,当*表示匹配一个或多个前面的字符时,比如aaab和a*b,我们忽略字符串s的第一个元素a,比较aab和a*b。假如p[1] == * 时,可以尝试两种情况:情况一是递归比较s和p.substr(2);情况二是当s[0]可以匹配p[0]时, 尝试递归比较s.substr(1)和p,这里没有必要比较s.substr(1) 和 p.substr(2),因为这种情况已经包含在递归比较s.substr(1)和p当中了。假如p[1] != *,如果p[0]不匹配s[0],返回false,否则递归判断s.substr(1)和p.substr(1)。
动态规划:使用dp[i][j]
表示的状态是s的前i项和p的前j项是否匹配,详细思路请参考大佬写的,非常详细
程序源码
递归
class Solution { public: bool isMatch(string s, string p) { if (p.empty()) return s.empty(); if (p.size() >= 2 && p[1] == ‘*‘) { return isMatch(s, p.substr(2)) || (!s.empty() && (s[0] == p[0] || p[0] == ‘.‘) && isMatch(s.substr(1), p)); } return !s.empty() && (s[0] == p[0] || p[0] == ‘.‘) && isMatch(s.substr(1), p.substr(1)); } };
动态规划
class Solution { public: bool isMatch(string s, string p) { if(p.empty()) return s.empty(); //前面加某一相同字符,防止 (ab, c*ab) 这样的匹配,避免复杂的初始化操作 s = " " + s; p = " " + p; int m = s.size(); int n = p.size(); //定义记忆数组,并初始化为false vector<vector<bool>> dp(m + 1, vector<bool>(n + 1, false)); //空串和空正是匹配的 dp[0][0] = true; //因为数组dp能保持字符串上一个字符的状态,所以可以对下一个字符进行判断,数组开m+1和n+1大小,便于对空串的处理 for (int i = 1; i < m + 1; i++) { for (int j = 1; j < n + 1; j++) { //不带‘*‘时的匹配 if (s[i - 1] == p[j - 1] || p[j - 1] == ‘.‘) { dp[i][j] = dp[i - 1][j - 1]; } else if (p[j - 1] == ‘*‘) { //考虑‘*‘时的情况 if (s[i - 1] != p[j - 2] && p[j - 2] != ‘.‘) { dp[i][j] = dp[i][j - 2]; } else { dp[i][j] = dp[i][j - 2] || dp[i - 1][j]; } } } } return dp[m][n]; } };
参考文章
以上是关于面试题19:正则表达式匹配(C++)的主要内容,如果未能解决你的问题,请参考以下文章