r:使用 hclust() 时在表/数据框中获取最终集群结果

Posted

技术标签:

【中文标题】r:使用 hclust() 时在表/数据框中获取最终集群结果【英文标题】:r: Obtaining final cluster results in a table/ dataframe when using hclust() 【发布时间】:2016-08-13 09:03:24 【问题描述】:

我正在使用hclust() 进行层次聚类分析

代码如下所示:

hc <- hclust(dist(USArrests), "ave")

现在,我需要的只是获取一个表(或等效的东西),其中包含所有集群和属于它们的观察值(通过它们的行名,而不是编号),以便我可以将其保存到某个整体文件/数据框 -例如Excel。 (我想用不同的方法、变量多次运行 hclust 并最终评估结果。)

我现在,它可能很容易,但我不知何故被卡住了......你有什么建议吗?

Ps.:我也想知道使用kmeans()时这是如何工作的

【问题讨论】:

【参考方案1】:

hclust 不会为您提供集群组。您可以使用cutree 将它们聚集在一起。 所以,如果你想把它们分成三组;

cutree(hc,3) 

如果你想要数据框,

data.frame(cutree(hc,3)) 

对于kmeans,

km<-kmeans(USArrests,3)

km$centers

【讨论】:

以上是关于r:使用 hclust() 时在表/数据框中获取最终集群结果的主要内容,如果未能解决你的问题,请参考以下文章