机器学习之K近邻简介

Posted 2022-12-06 未央夜色

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习之K近邻简介相关的知识，希望对你有一定的参考价值。

描述

KNN是常见的监督学习算法，输入是实例的特征向量，输出是实例对应的类别。
给定测试样本，基于某种距离计算方法，计算出与其距离最近的K个训练样本，根据多数表决方法判定属于哪个类别。

典型的懒惰学习算法，不具有显示的学习过程。在接受数据时，不做处理，当真正计算的时候才按照算法流程走。
三大要素：

kd树的构造。
由于KNN可能的数据量比较大，导致时间复杂度非常大，为了提升效率，引出了kd树数据结构（kd Tree）。
平衡kd树未必是效率最高的。

加权KNN
不是对元素简单的求平均，而是求他的加权平均
每一项的值*他的权重。

降维
距离计算的各种算法（欧氏距离，曼哈顿距离等）
KDTree
ballTree

以上是关于机器学习之K近邻简介的主要内容，如果未能解决你的问题，请参考以下文章