从K近邻算法距离度量谈到KD树SIFT+BBF算法
Posted yibeimingyue
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从K近邻算法距离度量谈到KD树SIFT+BBF算法相关的知识,希望对你有一定的参考价值。
https://blog.csdn.net/v_july_v/article/details/8203674
1.3、K值的选择
除了上述1.2节如何定义邻居的问题之外,还有一个选择多少个邻居,即K值定义为多大的问题。不要小看了这个K值选择问题,因为它对K近邻算法的结果会产生重大影响。如李航博士的一书「统计学习方法」上所说:
如果选择较小的K值,就相当于用较小的领域中的训练实例进行预测,“学习”近似误差会减小,只有与输入实例较近或相似的训练实例才会对预测结果起作用,与此同时带来的问题是“学习”的估计误差会增大,换句话说,K值的减小就意味着整体模型变得复杂,容易发生过拟合;
如果选择较大的K值,就相当于用较大领域中的训练实例进行预测,其优点是可以减少学习的估计误差,但缺点是学习的近似误差会增大。这时候,与输入实例较远(不相似的)训练实例也会对预测器作用,使预测发生错误,且K值的增大就意味着整体的模型变得简单。
K=N,则完全不足取,因为此时无论输入实例是什么,都只是简单的预测它属于在训练实例中最多的累,模型过于简单,忽略了训练实例中大量有用信息。
以上是关于从K近邻算法距离度量谈到KD树SIFT+BBF算法的主要内容,如果未能解决你的问题,请参考以下文章