集群质量度量

Posted

技术标签:

【中文标题】集群质量度量【英文标题】:Cluster quality measures 【发布时间】:2012-05-09 02:04:09 【问题描述】:

Matlab 是否提供任何工具来评估聚类方法? (集群紧凑性和集群分离......) 或者有什么工具箱吗?

【问题讨论】:

【参考方案1】:

Matlab 提供Silhouette index 并且有一个工具箱CVAP: Cluster Validity Analysis Platform 用于Matlab。其中包括以下有效性指标:

戴维斯-博尔丁 卡林斯基-哈拉巴斯 邓恩指数 R 平方指数 Hubert-Levin(C 指数) Krzanowski-Lai 指数 Hartigan 索引 均方根标准差 (RMSSTD) 指数 半偏 R 平方 (SPR) 指数 两个簇 (CD) 索引之间的距离 加权内部指数 同质指数 分离指数

请注意,您可能需要为您的平台预编译 LIBRA binaries。

【讨论】:

【参考方案2】:

不是在 Matlab 中,但 ELKI (Java) 提供了十几个用于评估的集群质量度量。

【讨论】:

【参考方案3】:

您可以从统计工具箱尝试Silhouette plot。

示例见this documentation。

【讨论】:

谢谢。但我想使用验证函数作为粒子群聚类的适应度/目标函数。【参考方案4】:

请注意,Matlab 中的剪影对于单例集群有一些奇怪的行为。它为单身人士分配 1 分,而对我来说,更合理的方法是为这些集群分配 0 分。在 Matlab 实现中,如果您将簇数作为对象数,Silhouette 会给您 1 分。

【讨论】:

以上是关于集群质量度量的主要内容,如果未能解决你的问题,请参考以下文章

4.DevOps-4.度量指标--0.度量指标(Metrics)

进行微服务治理,先要对微服务进行度量

如何设立正确的质量度量

我们怎么能说聚类质量度量是好的?

质量小议6 -- 无处不在的度量

质量小议6 -- 无处不在的度量