Levenshtein计算字符串的相似度

Posted 大圣的笑

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Levenshtein计算字符串的相似度相关的知识,希望对你有一定的参考价值。

 

        static void Main(string[] args)
        {

            Levenshtein(@"今天天气不错", @"今天的天气不错啊");

            Console.Read();
        }

        /// <summary>
        /// 字符串相似度计算
        /// </summary>
        /// <param name="str1"></param>
        /// <param name="str2"></param>
        public static void Levenshtein(String str1, String str2)
        {
            //计算两个字符串的长度。  
            int len1 = str1.Length;
            int len2 = str2.Length;
            //建立上面说的数组,比字符长度大一个空间  
            int[,] dif = new int[len1 + 1, len2 + 1];
            //赋初值,步骤B。  
            for (int a = 0; a <= len1; a++)
            {
                dif[a, 0] = a;
            }
            for (int a = 0; a <= len2; a++)
            {
                dif[0, a] = a;
            }
            //计算两个字符是否一样,计算左上的值  
            int temp;
            for (int i = 1; i <= len1; i++)
            {
                for (int j = 1; j <= len2; j++)
                {
                    if (str1[i - 1] == str2[j - 1])
                    {
                        temp = 0;
                    }
                    else
                    {
                        temp = 1;
                    }
                    //取三个值中最小的  
                    dif[i, j] = min(dif[i - 1, j - 1] + temp, dif[i, j - 1] + 1,
                            dif[i - 1, j] + 1);
                }
            }
            Console.WriteLine("字符串\"" + str1 + "\"与\"" + str2 + "\"的比较");
            //取数组右下角的值,同样不同位置代表不同字符串的比较  
            Console.WriteLine("差异步骤:" + dif[len1, len2]);
            //计算相似度  
            float similarity = 1 - (float)dif[len1, len2] / Math.Max(str1.Length, str2.Length);
            Console.WriteLine("相似度:" + similarity + " 越接近1越相似");
        }

        /// <summary>
        /// 得到最小值
        /// </summary>
        /// <param name="num"></param>
        /// <returns></returns>
        private static int min(params int[] num)
        {
            int min = Int32.MaxValue;
            foreach (var n in num)
            {
                if (min > n)
                {
                    min = n;
                }
            }
            return min;
        }

 

以上是关于Levenshtein计算字符串的相似度的主要内容,如果未能解决你的问题,请参考以下文章

计算两组标签相似度算法——levenshtein distance 编辑距离算法

python中是不是有用于计算两个字符串相似度的函数

Levenshtein计算相似度距离

与 Python + Sqlite 的字符串相似度(Levenshtein 距离/编辑距离)

字符串相似度算法——Levenshtein Distance算法

字符串相似度算法——Levenshtein Distance算法