[华为]计算字符串的相似度
Posted 飞鸟各投林
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[华为]计算字符串的相似度相关的知识,希望对你有一定的参考价值。
链接:https://www.nowcoder.com/questionTerminal/f549ee08ddd84b8485a4fa9aefaf4a38
来源:牛客网
对于不同的字符串,我们希望能有办法判断相似程度,我们定义了一套操作方法来把两个不相同的字符串变得相同,具体的操作方法如下:
1 修改一个字符,如把“a”替换为“b”。
2 增加一个字符,如把“abdd”变为“aebdd”。
3 删除一个字符,如把“travelling”变为“traveling”。
比如,对于“abcdefg”和“abcdef”两个字符串来说,我们认为可以通过增加和减少一个“g”的方式来达到目的。上面的两种方案,都只需要一次操作。把这个操作所需要的次数定义为两个字符串的距离,而相似度等于“距离+1”的倒数。也就是说,“abcdefg”和“abcdef”的距离为1,相似度为1/2=0.5.
给定任意两个字符串,你是否能写出一个算法来计算出它们的相似度呢?
请实现如下接口
/* 功能:计算字符串的相似度
* 输入:pucAExpression/ pucBExpression:字符串格式,如: "abcdef"
* 返回:字符串的相似度,相似度等于“距离+1”的倒数,结果请用1/字符串的形式,如1/2
*/
public static String calculateStringDistance(String expressionA, String expressionB)
{
/* 请实现*/
return null;
}
约束:
1、PucAExpression/ PucBExpression字符串中的有效字符包括26个小写字母。
2、PucAExpression/ PucBExpression算术表达式的有效性由调用者保证;
3、超过result范围导致信息无法正确表达的,返回null。
输入描述:
输入两个字符串
输出描述:
输出相似度,string类型
输入例子:
abcdef abcdefg
输出例子:
1/2
#include <iostream> #include <string> #include <algorithm> using namespace std; int main () { string s1,s2; while( cin>>s1>>s2) { int len1 = s1.size(); int len2 = s2.size(); vector<vector<int>> dp(len1+1, vector<int>(len2+1,0)); for(int i = 0; i <= len1; i++) dp[i][0] = i; for(int i = 0; i <= len2; i++) dp[0][i] = i; // for(int i = 1; i <= len1; i++) { for(int j = 1; j <= len2; j++) { if(s1[i-1] == s2[j-1]) dp[i][j] = dp[i-1][j-1]; else{ int tmp = min(dp[i-1][j], dp[i][j-1]); dp[i][j] = 1 + min(tmp, dp[i-1][j-1]); } } } cout<<‘1‘<<‘/‘<<(dp[len1][len2]+1)<<endl; } return 0; }
以上是关于[华为]计算字符串的相似度的主要内容,如果未能解决你的问题,请参考以下文章
R语言计算杰卡德相似系数(Jaccard Similarity)实战:自定义函数计算Jaccard相似度对字符串向量计算Jaccard相似度将Jaccard相似度转化为Jaccard距离