r:使用 hclust() 时在表/数据框中获取最终集群结果

Posted

技术标签:

【中文标题】r:使用 hclust() 时在表/数据框中获取最终集群结果【英文标题】:r: Obtaining final cluster results in a table/ dataframe when using hclust() 【发布时间】:2016-08-13 09:03:24 【问题描述】:

我正在使用hclust() 进行层次聚类分析

代码如下所示:

hc <- hclust(dist(USArrests), "ave")

现在,我需要的只是获取一个表(或等效的东西),其中包含所有集群和属于它们的观察值(通过它们的行名,而不是编号),以便我可以将其保存到某个整体文件/数据框 -例如Excel。 (我想用不同的方法、变量多次运行 hclust 并最终评估结果。)

我现在,它可能很容易,但我不知何故被卡住了......你有什么建议吗?

Ps.:我也想知道使用kmeans()时这是如何工作的

【问题讨论】:

【参考方案1】:

hclust 不会为您提供集群组。您可以使用cutree 将它们聚集在一起。 所以,如果你想把它们分成三组;

cutree(hc,3) 

如果你想要数据框,

data.frame(cutree(hc,3)) 

对于kmeans,

km<-kmeans(USArrests,3)

km$centers

【讨论】:

以上是关于r:使用 hclust() 时在表/数据框中获取最终集群结果的主要内容,如果未能解决你的问题,请参考以下文章

获取行数据时在表视图中显示活动指示器

如何通过Rpy2(v3)在Python中使用R中的`hclust`函数?

如何在 R 中使用“hclust”作为函数调用

R:层次聚类分析-dist、hclust、heatmap等

如何手动创建树状图(或“hclust”)对象? (在 R 中)

R中merge