weka 中的 ClusterMembership 类有啥作用?

Posted

技术标签:

【中文标题】weka 中的 ClusterMembership 类有啥作用?【英文标题】:what does ClusterMembership class in weka do?weka 中的 ClusterMembership 类有什么作用? 【发布时间】:2016-01-29 00:24:53 【问题描述】:

我正在使用 weka 进行一些分类实验。我正在尝试 weka 提供的一些可以应用于提取属性的功能,我发现在属性上应用集群成员将提供比其他方法相对更高的准确性。我不太确定这个功能做了什么,因为它删除了所有属性,只保留 pCluster_0_0 、 pCluster_1_0 、 pCluster_2_0 和类属性。所以我不太确定我从中得到的结果是否有效它是否适用于其他新的看不见的实例。来自 Weka 文档

使用基于密度的聚类器生成聚类成员值的过滤器;过滤的实例由这些值加上类属性(如果在输入数据中设置)组成。如果设置了(名义)类属性,则集群器会为每个类单独运行。在集群操作期间,类属性(如果设置)和任何用户指定的属性都将被忽略。

我非常感谢任何有助于理解这一点的帮助。

【问题讨论】:

【参考方案1】:

它基本上完成了您阅读的文档所描述的内容!它使用聚类算法来获取每个输入实例的集群成员(即实例所属的集群)并将它们作为新实例输出。需要注意的是,所使用的聚类算法必须是基于密度的聚类器,例如 DBSCAN 或期望最大化。

至于您的结果是否有效,您需要针对集群器运行测试集或进行百分比拆分评估。您的数据可能过度拟合!

【讨论】:

以上是关于weka 中的 ClusterMembership 类有啥作用?的主要内容,如果未能解决你的问题,请参考以下文章

显示加权平均的问号。 weka中的精度

WEKA 中的先验

Weka中的实例分类

WEKA中的预测结果是啥意思?

WEKA 中的集群评估是啥?

如何解释 Weka 中的 SVM 输出?