第二章:k-近邻算法(kNN)

Posted maxiaonong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第二章:k-近邻算法(kNN)相关的知识,希望对你有一定的参考价值。

  kNN功能:解决输入是数值型或者标称型的分类问题

  kNN大致原理:输入数据集相当于在一定维度的空间中标点,测试集(或者说要预测标签的),相当于是计算与这些已有点的距离(一般是欧式距离),选择前k个距离最近的,看这k个已标点的标签是什么(也就是属于哪一类),返回k个中占比最大的标签作为预测结果。ps:k一般取20

  算法大体步骤:

        1)计算已知类别数据集(训练集)中的点与当前点之间的距离

  2)按照距离递增次序排序

  3)选取与当前点距离最小的k个点

  4)确定前k个点所在类别出现的频率

  5)返回前k个点出现频率最高的类别作为当前点的预测分类

以上是关于第二章:k-近邻算法(kNN)的主要内容,如果未能解决你的问题,请参考以下文章

机器学习实战之第二章 k-近邻算法

KNN算法,k近邻

数据挖掘-K-近邻算法

K-近邻(KNN)算法

机器学习实战☛k-近邻算法(K-Nearest Neighbor, KNN)

机器学习实战—— k-近邻算法