集群质量度量
Posted
技术标签:
【中文标题】集群质量度量【英文标题】:Cluster quality measures 【发布时间】:2012-05-09 02:04:09 【问题描述】:Matlab 是否提供任何工具来评估聚类方法? (集群紧凑性和集群分离......) 或者有什么工具箱吗?
【问题讨论】:
【参考方案1】:Matlab 提供Silhouette index 并且有一个工具箱CVAP: Cluster Validity Analysis Platform 用于Matlab。其中包括以下有效性指标:
戴维斯-博尔丁 卡林斯基-哈拉巴斯 邓恩指数 R 平方指数 Hubert-Levin(C 指数) Krzanowski-Lai 指数 Hartigan 索引 均方根标准差 (RMSSTD) 指数 半偏 R 平方 (SPR) 指数 两个簇 (CD) 索引之间的距离 加权内部指数 同质指数 分离指数请注意,您可能需要为您的平台预编译 LIBRA binaries。
【讨论】:
【参考方案2】:不是在 Matlab 中,但 ELKI (Java) 提供了十几个用于评估的集群质量度量。
【讨论】:
【参考方案3】:您可以从统计工具箱尝试Silhouette plot。
示例见this documentation。
【讨论】:
谢谢。但我想使用验证函数作为粒子群聚类的适应度/目标函数。【参考方案4】:请注意,Matlab 中的剪影对于单例集群有一些奇怪的行为。它为单身人士分配 1 分,而对我来说,更合理的方法是为这些集群分配 0 分。在 Matlab 实现中,如果您将簇数作为对象数,Silhouette 会给您 1 分。
【讨论】:
以上是关于集群质量度量的主要内容,如果未能解决你的问题,请参考以下文章