具有 metric='russellrao' 的 DBSCAN 集群

Posted

技术标签:

【中文标题】具有 metric=\'russellrao\' 的 DBSCAN 集群【英文标题】:DBSCAN cluster with metric='russellrao'具有 metric='russellrao' 的 DBSCAN 集群 【发布时间】:2018-09-01 18:21:19 【问题描述】:

我在使用 sklearn.cluster.DBSCAN 时遇到了问题。 如果我使用DBSCAN(metric="russellrao"),应该是哪种数据格式? 我尝试了两种方法,都返回 pred = [-1 -1 -1 ..., -1 -1 -1] 。可以看到下面的2种数据格式。

npy = df2.values
y_pred = DBSCAN(metric="russellrao").fit_predict(npy)

1。 npy =

2。 npy =

打印 y_pred [-1 -1 -1 ..., -1 -1 -1]

那么,哪种格式是正确的答案?

【问题讨论】:

欢迎来到 SO,请避免截图,使用复制粘贴并相应地格式化。寻求帮助是没有用的,就字节而言更重,根本不方便。 【参考方案1】:

需要适当地选择其他DBSCAN参数。

恕我直言,sklearn 应该为它们设置默认值。特别是 epsilon 很大程度上取决于您的数据集和指标,因此默认值几乎总是一个糟糕的选择。与其提供糟糕的默认值,不如强制用户选择参数。

【讨论】:

是的,我知道,但我只是不确定该指标是否有参数“russellrao”。我怎样才能找到所有参数?文档(sklearn.lzjqsdd.com/modules/generated/…)太牛逼了。跨度> 如果您按照兔子进入文档,您可以获得有效支持的指标列表。或者你自己添加。

以上是关于具有 metric='russellrao' 的 DBSCAN 集群的主要内容,如果未能解决你的问题,请参考以下文章

路由表中的metric下的数字是啥意思?

Prometheus学习系列之Prometheus 数据模型和metric类型

A Peer-to-Peer Information System Based on the XOR Metric 部分翻译

度量学习

如何在 Keras 中将 Sklearn Metric 实现为 Metric?

Elasticsearch聚合初探——metric篇