这些 R 代码的含义是啥?它们是不是相关?
Posted
技术标签:
【中文标题】这些 R 代码的含义是啥?它们是不是相关?【英文标题】:Meaning of these R codes? Are they correlated?这些 R 代码的含义是什么?它们是否相关? 【发布时间】:2017-04-02 13:21:53 【问题描述】:我正在研究 R 中的 iris 数据集,我想澄清一下以下两个代码:
cluster_iris<-kmeans(iris[,1:4], centers=3)
iris$ClusterM <- as.factor(cluster_iris$cluster)
我认为第一个是使用数据文件的所有案例执行 k-means 聚类分析,并且只有前 4 列可以选择 3 个聚类。 但是我不确定第二段代码在做什么?第一个只是说明分析的偏好,而第二个实际执行它(即执行 k-means)?
感谢任何帮助
【问题讨论】:
R 中的每个函数都有文档记录。你可以学习help("<-")
, help("$<-")
, help("kmeans")
, help("as.factor")
, ... 参考文档并不丢人。我经常这样做。
【参考方案1】:
第一行进行聚类分析,并将聚类标签存储在一个名为 cluster_iris$cluster
的组件中,它只是一个数字向量。
第二行将该聚类编号作为分类标签放在原始数据集的行上。因此,现在您的 iris 数据在名为 "ClusterM"
的列中包含所有花瓣和萼片内容以及集群索引。
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species ClusterM
1 5.1 3.5 1.4 0.2 setosa 1
2 4.9 3.0 1.4 0.2 setosa 3
3 4.7 3.2 1.3 0.2 setosa 3
4 4.6 3.1 1.5 0.2 setosa 3
【讨论】:
以上是关于这些 R 代码的含义是啥?它们是不是相关?的主要内容,如果未能解决你的问题,请参考以下文章
注释是不是允许与预处理器指令在同一行,在这种情况下它们的含义是啥?
在 RStudio 中运行 pivot_wider() 时这些错误消息的含义是啥?