如何在 weka 中使用高尔距离进行 KNN?

Posted

技术标签:

【中文标题】如何在 weka 中使用高尔距离进行 KNN?【英文标题】:how to use Gower's Distance for KNN in weka? 【发布时间】:2017-01-20 14:21:22 【问题描述】:

目前我正在研究 KNN 分类,我的数据集中既有分类变量也有连续变量。所以我决定使用 Gower 距离作为 KNN 的相似性度量。但是对于 KNN 分类,weka 中没有 gower 距离。有没有办法使用 Weka 将 Gower 的距离用于 KNN?如果可能,我该如何实现?

【问题讨论】:

【参考方案1】:

首先,您应该检查在 Weka 中是如何实现类似算法的。我建议看看EuclideanDistance是如何实现的。

基于此,您现在可以创建自己喜欢的算法。

最后,您必须在 Weka 中添加新功能。为此,您必须查看手册。更多详情请查看here 和here

【讨论】:

以上是关于如何在 weka 中使用高尔距离进行 KNN?的主要内容,如果未能解决你的问题,请参考以下文章

Weka 中的 KNN 算法永远不会在大型数据集上完成

kNN - 如何根据计算出的距离在训练矩阵中定位最近的邻居

如何在 sklearn 中使用 gower 距离实现 pam 聚类算法?

KNN 在 K=1 时给出最高精度?

K近邻(KNN)算法是基于实例的算法,如果训练样本数量庞大,预测的时候挨个计算距离效率会很低下,如何破解?

如何使用 KNN /K-means 在数据框中对时间序列进行聚类