0 问题
给定两个字符串,求最长公共子序列LCS。
也就是说两个字符串中都有的部分,或者理解为,两个字符串同时都删除字符串中的某些字符,使得最终的两个字符串,相等,且是最长的。
1 分析
假设两个str1,str2字符串,已经知道了最长公共子序列长度为L
那么,当在str1和str2,两个的尾部,同时添加一个相同的字符,比如a,那么新的str1,和str2的最长公共子序列长度就是L+1
当str1后面添加一个字符,str2不添加,那么最长公共子序列长度为L
反之,str1不添加,str2添加,那么也是L
当同时添加一个字符,但是添加不同的字符,那么长度仍为L
因此,可以考虑
int lcs(string str1, string str2) { int len1 = str1.size(); int len2 = str2.size(); // memo[i][j] 中记录的是,字符串从第0个字符开始,长度为i,或是j的子数组的lcs长度 vector<vector<int>> memo(len1 + 1, vector<int>(len2 + 1, 0)); // i,j都是长度,表示从第0个字符开始长为i或j的子字符串 // 因此使用的是 str1[i - 1] == str2[j - 1] 来比较 // i,j都不断的递增,则可认为是不断的添加字符 for (int i = 1; i <= str1.size(); ++i) { for (int j = 1; j <= str2.size(); ++j) { if (str1[i - 1] == str2[j - 1]) { // 当两个字符相同的时候,就认为,是比之前的子数组的lcs长度大1 memo[i][j] = memo[i - 1][j - 1] + 1; } else { // 如果新添加的两个字符不相同,那么取之前的 L // 但是可能是str1 加字符得来的,也可能是str2 加字符得来的,因此需要取两个前状态的lcs的长度最大值 if (memo[i - 1][j] > memo[i][j - 1]) { memo[i][j] = memo[i - 1][j]; } else { memo[i][j] = memo[i][j - 1]; } } } } return memo[len1][len2]; }
或者说,也可以这样考虑,
str1,和str2,当最后一个字符相同,那么,str1,和str2的最长公共子序列的长度应该是,str-1和str2-1的最长公共子序列长度+1
当最后一个字符不相同的时候,那么,str1,和str2的最长公共子序列的长度应该是(str1-1和str2)与(str1和str2-1)的最长公共子序列长度的较大的那个。
但是这样计算大量相同的问题,因此加上memo
int aux_lcs_d(string str1, int l1, string str2, int l2,vector<vector<int>> &memo) { if (l1 < 0 || l2 < 0) { return 0; } if(memo[l1][l2] != 0) { return memo[l1][l2]; } if (str1[l1] == str2[l2]) { memo[l1][l2]= aux_lcs_d(str1, l1 - 1, str2, l2 - 1,memo) + 1; return memo[l1][l2]; } else { memo[l1][l2]= max(aux_lcs_d(str1, l1, str2, l2 - 1,memo), aux_lcs_d(str1, l1 - 1, str2, l2,memo)); return memo[l1][l2]; } } int lcs_d(string str1,string str2) { vector <vector<int>> memo(str1.size(),vector<int>(str2.size(),0)); return aux_lcs_d(str1, str1.size()-1, str2, str2.size()-1,memo) ; }
以上就是计算lcs长度的思路.
当需要计算出完成的路径时。添加一个额外的容器,记录,每个状态是怎么从前一个状态转移过来的
int aux_lcs_d(string str1, int l1, string str2, int l2,vector<vector<int>> &memo,vector<vector<int>> &path) { if (l1 < 0 || l2 < 0) { return 0; } if(memo[l1][l2] != 0) { return memo[l1][l2]; } if (str1[l1] == str2[l2]) { path[l1][l2]=‘0‘; // 这个表示从str1 ,str2同时增长来的 memo[l1][l2]= aux_lcs_d(str1, l1 - 1, str2, l2 - 1,memo,path) + 1; return memo[l1][l2]; } else { int tmp1=aux_lcs_d(str1, l1, str2, l2 - 1,memo,path); int tmp2=aux_lcs_d(str1, l1 - 1, str2, l2,memo,path); memo[l1][l2]= max(tmp1,tmp2); if(tmp1==memo[l1][l2]) { // 表示从 str2 增长来的 path[l1][l2]=‘2‘; }else{ // 从str1 增长来的 path[l1][l2]=‘1‘; } return memo[l1][l2]; } }