scikit_learn (sklearn)库中NearestNeighbors(最近邻)函数的各参数说明

Posted qfwmy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scikit_learn (sklearn)库中NearestNeighbors(最近邻)函数的各参数说明相关的知识,希望对你有一定的参考价值。

NearestNeighbors(n_neighbors=5, radius=1.0, algorithm=‘auto‘, leaf_size=30, metric=‘minkowski‘, p=2, metric_params=None, n_jobs=None)

Parameters(参数):

    n_neighbors(n邻域):所要选用的最近邻的数目,相当于knn算法(k近邻算法)中的 k,(default = 5),在设置此参数时输入的需为整形(int)。

    radius(半径):要使用的参数空间范围,在设置此参数时输入的需为浮点数(float)。

    algorithm{‘auto’, ‘ball_tree’, ‘kd_tree’, ‘brute’}:即用于选取计算最近邻的算法:这里主要包括

    ‘auto’      :根据样本数据自动刷选合适的算法。

           ‘ball_tree’:构建“球树”算法模型。

           ‘kd_tree’ :‘’kd树‘’算法。

           ‘brute’     :使用蛮力搜索,即或相当于Knn算法,需遍历所有样本数据与目标数据的距离,进而按升序排序从而选取最近的K个值,采用投票得出结果。

          ( 注意:拟合稀疏输入将覆盖此参数的设置,使用蛮力。)

     leaf_size叶的大小,针对算法为球树或KD树而言。这个设置会影响构造和查询的速度,以及存储树所需的内存。最优值取决于问题的性质。

     metric:用于树的距离度量。默认度量是Minkowski,p=2等价于标准的欧几里德度量。有关可用度量的列表,可以查阅距离度量类的文档。如果度量是“预先计算的”,则假定X是距离矩阵,在拟合期间必须是平方。

     p:Minkowski度量参数的参数来自sklearn.emeics.pairwise.pairwise_距离。当p=1时,这等价于使用曼哈顿距离(L1),欧几里得距离(L2)等价于p=2时,对于任意的p,则使用Minkowski_距离(L_P)。

     metric_params:度量函数的附加关键字参数,设置应为dict(字典)形式。

     n_jobs:要为邻居搜索的并行作业的数量。None指1,除非在 joblib.parallel_backend背景。-1意味着使用所有处理器,若要了解相关的知识应该具体查找一下。

以上是关于scikit_learn (sklearn)库中NearestNeighbors(最近邻)函数的各参数说明的主要内容,如果未能解决你的问题,请参考以下文章

spyder 中未定义模块 scikit_learn

无法克隆对象 <tensorflow.python.keras.wrappers.scikit_learn.KerasClassifier 对象

sklearn 库中 .score() 和 .predict 的区别?

从“sklearn”Python库中得到很多错误[关闭]

1.1.3:sklearn库中的标准数据集及基本功能

Sklearn LinearSVC库中惩罚和损失参数的区别