这些 R 代码的含义是啥？它们是不是相关？

Posted 2023-03-12

技术标签:

【中文标题】这些 R 代码的含义是啥？它们是不是相关？【英文标题】：Meaning of these R codes? Are they correlated?这些 R 代码的含义是什么？它们是否相关？ 【发布时间】：2017-04-02 13:21:53 【问题描述】：

我正在研究 R 中的 iris 数据集，我想澄清一下以下两个代码：

cluster_iris<-kmeans(iris[,1:4], centers=3)

iris$ClusterM <- as.factor(cluster_iris$cluster)

我认为第一个是使用数据文件的所有案例执行 k-means 聚类分析，并且只有前 4 列可以选择 3 个聚类。但是我不确定第二段代码在做什么？第一个只是说明分析的偏好，而第二个实际执行它（即执行 k-means）？

感谢任何帮助

【问题讨论】：

R 中的每个函数都有文档记录。你可以学习help("<-"), help("$<-"), help("kmeans"), help("as.factor"), ... 参考文档并不丢人。我经常这样做。 【参考方案1】：

第一行进行聚类分析，并将聚类标签存储在一个名为 cluster_iris$cluster 的组件中，它只是一个数字向量。

第二行将该聚类编号作为分类标签放在原始数据集的行上。因此，现在您的 iris 数据在名为 "ClusterM" 的列中包含所有花瓣和萼片内容以及集群索引。

> head(iris)
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species ClusterM
1          5.1         3.5          1.4         0.2  setosa        1
2          4.9         3.0          1.4         0.2  setosa        3
3          4.7         3.2          1.3         0.2  setosa        3
4          4.6         3.1          1.5         0.2  setosa        3

【讨论】：

以上是关于这些 R 代码的含义是啥？它们是不是相关？的主要内容，如果未能解决你的问题，请参考以下文章