相似度总结

Posted nxf-rabbit75

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了相似度总结相关的知识,希望对你有一定的参考价值。

1.余弦距离

适用场景:余弦相似度衡量的是维度间取值方向的一致性,注重维度之间的差异,不注重数值上的差异。

举例:如某T恤从100块降到了50块(A(100,50)),某西装从1000块降到了500块(B(1000,500)),那么T恤和西装都是降价了50%,两者的价格变动趋势一致,可以用余弦相似度衡量,即两者有很高的变化趋势相似度,但是从商品价格本身的角度来说,两者相差了好几百块的差距,欧氏距离较大,即两者有较低的价格相似度。

2.欧式距离

适用场景:欧氏度量的是数值上的差异性。

举例:如果要对电子商务用户做聚类,区分高价值用户和低价值用户,用消费次数和平均消费额,这个时候用余弦夹角是不恰当的,因为它会将(2,10)和(10,50)的用户算成相似用户,但显然后者的价值高得多,因为这个时候需要注重数值上的差异,而不是维度之间的差异。



 

参考文献:

【1】关于欧氏距离和余弦相似度的使用场景 - wo的博客 - CSDN博客

以上是关于相似度总结的主要内容,如果未能解决你的问题,请参考以下文章

图像视频相似度算法

文本、语音相似度算法

NLP 语义相似度计算 整理总结

各种距离和相似度总结

语义相似度相关文章链接

相似度/距离方法总结