r:使用 hclust() 时在表/数据框中获取最终集群结果
Posted
技术标签:
【中文标题】r:使用 hclust() 时在表/数据框中获取最终集群结果【英文标题】:r: Obtaining final cluster results in a table/ dataframe when using hclust() 【发布时间】:2016-08-13 09:03:24 【问题描述】:我正在使用hclust()
进行层次聚类分析
代码如下所示:
hc <- hclust(dist(USArrests), "ave")
现在,我需要的只是获取一个表(或等效的东西),其中包含所有集群和属于它们的观察值(通过它们的行名,而不是编号),以便我可以将其保存到某个整体文件/数据框 -例如Excel。 (我想用不同的方法、变量多次运行 hclust 并最终评估结果。)
我现在,它可能很容易,但我不知何故被卡住了......你有什么建议吗?
Ps.:我也想知道使用kmeans()
时这是如何工作的
【问题讨论】:
【参考方案1】:hclust
不会为您提供集群组。您可以使用cutree
将它们聚集在一起。
所以,如果你想把它们分成三组;
cutree(hc,3)
如果你想要数据框,
data.frame(cutree(hc,3))
对于kmeans,
km<-kmeans(USArrests,3)
km$centers
【讨论】:
以上是关于r:使用 hclust() 时在表/数据框中获取最终集群结果的主要内容,如果未能解决你的问题,请参考以下文章
如何通过Rpy2(v3)在Python中使用R中的`hclust`函数?