使用 RapidMiner 设计聚类过程

Posted

技术标签:

【中文标题】使用 RapidMiner 设计聚类过程【英文标题】:Designing a clustering process using RapidMiner 【发布时间】:2012-10-14 09:20:13 【问题描述】:

我在机器学习或集群方面没有太多经验,所以我对如何解决这个问题有点茫然。我感兴趣的数据由 4 列组成,其中一列只是一个 id。其他 3 个包含数值数据,值 >= 0。我需要的聚类实际上非常简单,我可以手动完成,但稍后会变得不太清楚,所以我想从正确的过程开始。我需要 6 个集群,它们取决于 3 列(称为 A、B 和 C),如下所示:

A    B    C        Cluster
---- ---- -------- -------
0    0    0        0
0    0    >0       1
0    >0   <=B      2
0    >0   >B       3
>0   any  <=(A+B)  4
>0   any  >(A+B)   5

在这个阶段,这些集群将提供对数据的洞察力,为进一步分析提供信息。

由于我对此很陌生,所以我对各种聚类算法的了解还不够,所以我真的不知道从哪里开始。谁能建议一个合适的模型来使用,或者我可以研究的一些模型。

【问题讨论】:

【参考方案1】:

这在我看来看起来像集群

相反,我认为您需要一个简单的决策树分类

它应该已经在 Rapidminer 中可用。

【讨论】:

感谢您的建议。我已经使用规则归纳让它工作了,但我已经查看了决策树,它绝对是我需要的!【参考方案2】:

您可以使用“生成属性”运算符。

这会从现有属性创建新属性。

创建所有规则会比较烦人,但它们会像

集群:if (((A==0)&&(B==0)&&(C==0)),1,0)

【讨论】:

这就是我开始的地方,但是规则会变得比我给出的示例更复杂,而且手动执行它们已经很烦人了。

以上是关于使用 RapidMiner 设计聚类过程的主要内容,如果未能解决你的问题,请参考以下文章

rapidminer 和 scikit-learn 中的 DBSCAN 算法

适用于非常小的集群的聚类算法

K-Means算法实现网页聚类

第9章-聚类学习理解记录

vue怎么展示聚类分析过程

密度聚类密度聚类过程OPTICS算法