376,动态规划之编辑距离
Posted 数据结构和算法
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了376,动态规划之编辑距离相关的知识,希望对你有一定的参考价值。
Everything goes back to the way it was.
一切终将恢复如初。
问题描述
给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
插入一个字符
删除一个字符
替换一个字符
示例 1:
输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
总有共3步
示例 2:
输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')
总有共5步
问题分析:
1,如果想把word1变为word2,对于word1的操作我们有3种方式:
删除一个字符
添加一个字符
修改一个字符
这就好比对数据库的增删改查一样,不过这里没有查找。
我们用dp[i][j]表示把word1的前i个字符变为word2的前j个字符所需要的最少编辑距离,这里要分两种情况
1,当word1[i]==word2[j]:也就是说word1的第i个字符和word2的第j个字符相等,我们不需要修改word1的第i个字符,所以这时dp[i][j]=dp[i-1][j-1]。
2,当word1[i]!=word2[j]:也就是说word1的第i个字符和word2的第j个字符不相等。这时我们可以有3种操作来计算dp[i][j];
删,dp[i-1][j]:表示的是word1的前i-1个字符和word2的前j个字符的最小编辑距离,在dp[i][j]中我们只需要把word1中第i个字符删除就是dp[i-1][j],所以dp[i][j]=dp[i-1][j]+1。
增,dp[i][j-1]:表示的是word1的前i个字符和word2的前j-1个字符的最小编辑距离,在dp[i][j]中我们只需要把word2中的第j个字符删除就是dp[i][j-1],所以dp[i][j]=dp[i][j-1]+1。(注:我们这一步明明是增,但这里为什么是删,因为我们这里删的是word2的字符,增和删是相对的,word2字符的删除也可以认为是word1字符的添加,举个例子,比如word1="a",word2="ab",我们在word1中添加一个b或者在word2中删除一个b,最短编辑距离都是一样的)
改,dp[i-1][j-1]:表示的是word1的前i-1个字符和word2的前j-1个字符的最小编辑距离,我们只需要把word1的第i个字符修改为word2的第j个字符就可以求出dp[i][j],所以dp[i][j]=dp[i-1][j-1]+1。
上面三种情况我们要选最小的,所以递推公式
1,当word1[i]==word2[j]:
dp[i][j]=dp[i-1][j-1]
2,当word1[i]!=word2[j]:
dp[i][j]=min{dp[i-1][j-1],dp[i-1][j],dp[i][j-1]}+1
边界条件:
如果word1为空,我们要把word1变为word2就是不停的插入,
如果word2为空,我们要把word1变为word2就是不停的删除。
下面我们来画个图看一下
举个例子,
比如(0,0)格内,我们只需要把h变为r即可,所以需要1步。
比如(0,1)格内,我们只需要把h变为r,然后删除O,所以需要2步。
比如(1,0)格内,我们只需要把h变为r,然后在添加一个O,所以需要2步。
比如(1,1)格内,因为O==O,我们只需要把h变为r即可,所以需要1步。
看懂了上面的分析过程,代码就容易多了,我们来看下代码
1public static int minDistance(String word1, String word2) {
2 int length1 = word1.length();
3 int length2 = word2.length();
4 if (length1 * length2 == 0)
5 return length1 + length2;//如果有一个为空,直接返回另一个的长度即可
6 int dp[][] = new int[length1 + 1][length2 + 1];
7 for (int i = 0; i <= length1; i++) {
8 dp[i][0] = i;//边界条件,相当于word1的删除操作
9 }
10 for (int i = 0; i <= length2; i++) {
11 dp[0][i] = i;//边界条件,相当于word1的添加操作
12 }
13 for (int i = 1; i <= word1.length(); i++) {
14 for (int j = 1; j <= length2; j++) {//下面是上面分析的递推公式
15 if (word1.charAt(i - 1) == word2.charAt(j - 1)) {//判断两个字符是否相等
16 dp[i][j] = dp[i - 1][j - 1];
17 } else {
18 dp[i][j] = Math.min(Math.min(dp[i - 1][j], dp[i][j - 1]), dp[i - 1][j - 1]) + 1;
19 }
20 }
21 }
22 Util.printTwoIntArrays(dp);//测试数据的打印,可去掉
23 return dp[length1][length2];
24}
代码比较简单,核心代码也就15到19行,其他的也就是一些边界的判断。
我们还用上面的数据测试一下,看一下打印结果
1public static void main(String args[]) {
2 System.out.println(minDistance("horse", "ros"));
3}
结果如下
和我们上面分析的完全一致。
我们看到虽然dp是二维数组,但我们计算的时候每个元素只和他的左边,上边,左上角的3个值有关,所以这里我们还可以优化一下,使用一维数组,我们看下代码
1public static int minDistance2(String word1, String word2) {
2 int length1 = word1.length();
3 int length2 = word2.length();
4 if (length1 * length2 == 0)
5 return length1 + length2;
6 int dp[] = new int[length2 + 1];
7 for (int i = 1; i <= length2; i++) {
8 dp[i] = i;
9 }
10 int last = 0;
11 for (int i = 1; i <= word1.length(); i++) {
12 last = dp[0];
13 dp[0] = i;
14 for (int j = 1; j <= length2; j++) {
15 int temp = dp[j];
16 if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
17 dp[j] = last;
18 } else {
19 dp[j] = Math.min(Math.min(dp[j - 1], dp[j]), last) + 1;
20 }
21 last = temp;
22 }
23 Util.printIntArrays(dp);//这两行代码仅做测试打印数据使用,可删除
24 System.out.println();
25 }
26 return dp[length2];
27}
代码中last记录的是左上角的值,因为这个值会被覆盖,所以我们提前记录了下来,我们还用上面的代码测试一下,再来看一下打印结果
结果和我们上面分析的完全一致。
总结:
这道题相对来说还是有一定的难度的,首先要了解什么是动态规划,然后再找出他的递推公式,还有一些边界条件的判断,最后是代码的优化。
●
●
●
长按上图,识别图中二维码之后即可关注。
如果喜欢这篇文章就点个"在看"吧
以上是关于376,动态规划之编辑距离的主要内容,如果未能解决你的问题,请参考以下文章