Levenshtein计算字符串的相似度
Posted 大圣的笑
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Levenshtein计算字符串的相似度相关的知识,希望对你有一定的参考价值。
static void Main(string[] args) { Levenshtein(@"今天天气不错", @"今天的天气不错啊"); Console.Read(); } /// <summary> /// 字符串相似度计算 /// </summary> /// <param name="str1"></param> /// <param name="str2"></param> public static void Levenshtein(String str1, String str2) { //计算两个字符串的长度。 int len1 = str1.Length; int len2 = str2.Length; //建立上面说的数组,比字符长度大一个空间 int[,] dif = new int[len1 + 1, len2 + 1]; //赋初值,步骤B。 for (int a = 0; a <= len1; a++) { dif[a, 0] = a; } for (int a = 0; a <= len2; a++) { dif[0, a] = a; } //计算两个字符是否一样,计算左上的值 int temp; for (int i = 1; i <= len1; i++) { for (int j = 1; j <= len2; j++) { if (str1[i - 1] == str2[j - 1]) { temp = 0; } else { temp = 1; } //取三个值中最小的 dif[i, j] = min(dif[i - 1, j - 1] + temp, dif[i, j - 1] + 1, dif[i - 1, j] + 1); } } Console.WriteLine("字符串\"" + str1 + "\"与\"" + str2 + "\"的比较"); //取数组右下角的值,同样不同位置代表不同字符串的比较 Console.WriteLine("差异步骤:" + dif[len1, len2]); //计算相似度 float similarity = 1 - (float)dif[len1, len2] / Math.Max(str1.Length, str2.Length); Console.WriteLine("相似度:" + similarity + " 越接近1越相似"); } /// <summary> /// 得到最小值 /// </summary> /// <param name="num"></param> /// <returns></returns> private static int min(params int[] num) { int min = Int32.MaxValue; foreach (var n in num) { if (min > n) { min = n; } } return min; }
以上是关于Levenshtein计算字符串的相似度的主要内容,如果未能解决你的问题,请参考以下文章
计算两组标签相似度算法——levenshtein distance 编辑距离算法
与 Python + Sqlite 的字符串相似度(Levenshtein 距离/编辑距离)