metric笔记:Jaccard 相似系数&Jaccard距离

Posted UQI-LIUWJ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了metric笔记:Jaccard 相似系数&Jaccard距离相关的知识,希望对你有一定的参考价值。

1 Jaccard相似系数

  • 给定两个集合A,B,Jaccard 系数定义为A与B交集的大小与A与B并集的大小的比值

2 Jaccard 距离

  • 用于描述集合之间的不相似程度
    • Jaccard距离越大,样本相似度越低

2.1 python实现

import numpy as np
import scipy.spatial.distance as dist  # 导入scipy距离公式
matV = np.mat([[0,1,1,0,1,0,1],[1,0,1,1,0,1,0]])
print ("dist.jaccard:", dist.pdist(matV,'jaccard'))

#dist.jaccard: [0.85714286]
# 6/7

以上是关于metric笔记:Jaccard 相似系数&Jaccard距离的主要内容,如果未能解决你的问题,请参考以下文章

相似性分析之Jaccard相似系数

用矩阵计算Jaccard相似系数

SQL Server计算Jaccard系数—sim(i,j)

Jaccard相关系数和Tanimoto系数

文本相似度计算(一):距离方法

Jaccard 评价指标的简介与图示