你如何在 R 中创建一个虚拟数据集? [复制]

Posted

技术标签:

【中文标题】你如何在 R 中创建一个虚拟数据集? [复制]【英文标题】:How do you make a dummy dataset in R? [duplicate] 【发布时间】:2021-12-19 19:09:38 【问题描述】:

我将如何制作一个数据集,其中每个“站点”、“季节”、“年份”和“物种名称”都完全交叉(每个站点都在每年/季节访问过,并且每个物种都可以随时被捕获和地点 -> 即 5 个地点 x 2 个季节 x 2 年 x 2 个物种 = df 大小为 40x5)。

df <- data.frame(site = rep(c("1", "2", "3", "4", "5"), each = 2),
                 season = rep(c("dry", "wet"), each = 10), 
                 year = rep(c(2019, 2020), each = 10), 
                 species_name = rep(c("Sailfin molly", "Hardhead silverside"), each = 10),
                 num = sample(x = 0:15, size  = 20, replace = TRUE))

【问题讨论】:

查看 expand.grid 【参考方案1】:

你可以使用expand.grid()函数:

library(tidyverse)

site <- c("1", "2", "3", "4", "5")
season <- c("dry", "wet")
year <-  c(2019, 2020)
species_name <-  c("Sailfin molly", "Hardhead silverside")
num <-  sample(x = 0:15, size  = 40, replace = TRUE)

df <- data.frame(expand.grid(site, season, year, species_name) %>% mutate(num = num))
colnames(df) <- c("site", "season", "year", "species_name", "num")

【讨论】:

以上是关于你如何在 R 中创建一个虚拟数据集? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

如何在 R 中创建聚类图?

如何在 R 中创建线性和逻辑回归模型?

如何使用 matplotlib 在 Python 中创建图例

求助,怎样同步控制两个虚拟机

如何从具有多个值和预定义类别的列表中创建虚拟对象? [复制]

使用大型数据集在 R 中创建二进制矩阵