使用 RapidMiner 设计聚类过程
Posted
技术标签:
【中文标题】使用 RapidMiner 设计聚类过程【英文标题】:Designing a clustering process using RapidMiner 【发布时间】:2012-10-14 09:20:13 【问题描述】:我在机器学习或集群方面没有太多经验,所以我对如何解决这个问题有点茫然。我感兴趣的数据由 4 列组成,其中一列只是一个 id。其他 3 个包含数值数据,值 >= 0。我需要的聚类实际上非常简单,我可以手动完成,但稍后会变得不太清楚,所以我想从正确的过程开始。我需要 6 个集群,它们取决于 3 列(称为 A、B 和 C),如下所示:
A B C Cluster
---- ---- -------- -------
0 0 0 0
0 0 >0 1
0 >0 <=B 2
0 >0 >B 3
>0 any <=(A+B) 4
>0 any >(A+B) 5
在这个阶段,这些集群将提供对数据的洞察力,为进一步分析提供信息。
由于我对此很陌生,所以我对各种聚类算法的了解还不够,所以我真的不知道从哪里开始。谁能建议一个合适的模型来使用,或者我可以研究的一些模型。
【问题讨论】:
【参考方案1】:这在我看来不看起来像集群。
相反,我认为您需要一个简单的决策树分类。
它应该已经在 Rapidminer 中可用。
【讨论】:
感谢您的建议。我已经使用规则归纳让它工作了,但我已经查看了决策树,它绝对是我需要的!【参考方案2】:您可以使用“生成属性”运算符。
这会从现有属性创建新属性。
创建所有规则会比较烦人,但它们会像
集群:if (((A==0)&&(B==0)&&(C==0)),1,0)
【讨论】:
这就是我开始的地方,但是规则会变得比我给出的示例更复杂,而且手动执行它们已经很烦人了。以上是关于使用 RapidMiner 设计聚类过程的主要内容,如果未能解决你的问题,请参考以下文章