相似系数常用的有哪几种
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了相似系数常用的有哪几种相关的知识,希望对你有一定的参考价值。
参考技术A相似系数常用的有哪几种如下:
定义在两个向量(两个点)上:点x和点y的欧式距离为:
常利用欧几里得距离描述相似度时,需要取倒数归一化,sim = 1.0/(1.0+distance),利用numpy实现如下:
python实现欧式距离
从名字就可以猜出这种距离的计算方法了。想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除非你能穿越大楼。实际驾驶距离就是这个“曼哈顿距离”。而这也是曼哈顿距离名称的来源, 曼哈顿距离也称为城市街区距离(City Block distance)。
(1)二维平面两点a(x1,y1)与b(x2,y2)间的曼哈顿距离
(2)两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的曼哈顿距离
python实现曼哈顿距离:
国际象棋玩过么?国王走一步能够移动到相邻的8个方格中的任意一个。那么国王从格子(x1,y1)走到格子(x2,y2)最少需要多少步?自己走走试试。你会发现最少步数总是max( | x2-x1 | , | y2-y1 | ) 步 。有一种类似的一种距离度量方法叫切比雪夫距离。
(1)二维平面两点a(x1,y1)与b(x2,y2)间的切比雪夫距离
(2)两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的切比雪夫距离
40常用字符串格式化有哪几种?
Python的字符串格式化常用的有三种!
第一种:最方便的
缺点:需一个个的格式化
print(‘hello %s and %s‘%(‘df‘,‘another df‘))
第二种:最好用的
优点:不需要一个个的格式化,可以利用字典的方式,缩短时间
print(‘hello %(first)s and %(second)s‘%{‘first‘:‘df‘ , ‘second‘:‘another df‘})
第三种:最先进的
优点:可读性强
print(‘hello {first} and {second}‘.format(first=‘df‘,second=‘another df‘))
以上是关于相似系数常用的有哪几种的主要内容,如果未能解决你的问题,请参考以下文章