第二章:k-近邻算法(kNN)
Posted maxiaonong
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第二章:k-近邻算法(kNN)相关的知识,希望对你有一定的参考价值。
kNN功能:解决输入是数值型或者标称型的分类问题
kNN大致原理:输入数据集相当于在一定维度的空间中标点,测试集(或者说要预测标签的),相当于是计算与这些已有点的距离(一般是欧式距离),选择前k个距离最近的,看这k个已标点的标签是什么(也就是属于哪一类),返回k个中占比最大的标签作为预测结果。ps:k一般取20
算法大体步骤:
1)计算已知类别数据集(训练集)中的点与当前点之间的距离
2)按照距离递增次序排序
3)选取与当前点距离最小的k个点
4)确定前k个点所在类别出现的频率
5)返回前k个点出现频率最高的类别作为当前点的预测分类
以上是关于第二章:k-近邻算法(kNN)的主要内容,如果未能解决你的问题,请参考以下文章