WEKA 中的集群评估是啥?

Posted

技术标签:

【中文标题】WEKA 中的集群评估是啥?【英文标题】:What is evaluation of a cluster in WEKA?WEKA 中的集群评估是什么? 【发布时间】:2012-06-08 09:23:20 【问题描述】:

当我们说我们正在评估 WEKA frmework 中的集群时,我们的意思是什么?聚类是一种对对象进行分组的无监督方法。当我们说我们想要评估结果时,我们的意思是什么?另外,除此之外,当我们说我们在训练数据本身之上评估集群时,这是什么意思?

谢谢 阿布舍克S

【问题讨论】:

Weka 在集群方面几乎不存在。如果您对聚类(比分类复杂一点)感兴趣,请寻找替代方案。关于评估的一些建议:对计数 f-measure、Adjusted Rand Index (ARI)、Fowlkes-Mallows index、Jaccard index、BCubed measure 等 - 我认为 Weka 没有这些。 【参考方案1】:

如this页面上所写:

评估 Weka 评估集群的方式取决于您选择的集群模式。有四种不同的集群模式可用(作为集群模式面板中的按钮):

    Use training set(默认)。生成聚类后,Weka 根据聚类表示将训练实例分类为聚类,并计算每个聚类中实例的百分比。例如,上述由 k-means 生成的聚类显示集群 0 中的 43%(6 个实例)和集群 1 中的 57%(8 个实例)。 在 Supplied test setPercentage split 中,如果集群表示是概率的(例如,对于 EM),Weka 可以在单独的测试数据上评估集群。 Classes to clusters evaluation。在这种模式下,Weka 首先忽略类属性并生成聚类。然后在测试阶段,它根据每个集群中类属性的多数值将类分配给集群。然后它根据这个分配计算分类错误,并显示相应的混淆矩阵。 k-means 的一个例子如下所示。

【讨论】:

感谢您的参考和详尽的回答。 知道类到集群评估如何为 EM 工作吗?在确定多数值时,它是否通过实例在集群中的概率对实例进行加权? sicco 如果可能的话你能检查一下这个问题吗:***.com/questions/32404742/…

以上是关于WEKA 中的集群评估是啥?的主要内容,如果未能解决你的问题,请参考以下文章

如何在weka中提取集群成员?

Weka EM 集群在 Eclipse 中得到“错误:无法找到或加载主类测试”

Weka分类前的聚类

EM Clustering with weka 对于某些集群的对数可能性为 0?令人困惑的输出

Weka 可视化聚类结果 [关闭]

了解 Weka 中的成本敏感评估(成本矩阵)