K近邻算法核心函数详解

Posted 2022-03-30 roscangjie

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了K近邻算法核心函数详解相关的知识，希望对你有一定的参考价值。

#用于分类的输入向量是inX，输入的训练样本集为dataSet，
#标签向量为 labels ，最后的参数 k 表示用于选择最近邻居的数目，其中标签向量的元素数目和矩阵 dataSet 的行数相同。
def classify0(inX,dataSet,labels,k):
    dataSetSize = dataSet.shape[0]    # 获取 数组 形状的 第一个 参数 a=[[1,2],[1,2],[1,2]]  a.shape = [3,2] a.shape[0] = 3
    diffMat = tile(inX,(dataSetSize,1)) - dataSet    # tile 代表了inX，复制为dataSetSize行，1列的数组
    sqDiffMat = diffMat**2      # 平方
    sqDistances = sqDiffMat.sum(axis = 1)       # axis 等于 1 是将 矩阵的每一行 相加
    distances = sqDistance**0.5       # 开方
    sortedDistIndicies = distances.argsort()      # 从小到大 排列
    classCount = 
    for i in range(k):                       # 求出来 最低距离 的 labels结果，存放在classCount 中
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel,0)+1
    sortedClassCount = sorted(classCount.iteritems(),
                            key = operator.itemgetter(1),reverse =True)
    return sortedClassCount[0][0]

以上是关于K近邻算法核心函数详解的主要内容，如果未能解决你的问题，请参考以下文章