使用 R 的样本数据 [重复]

Posted

技术标签:

【中文标题】使用 R 的样本数据 [重复]【英文标题】:Sample data using R [duplicate] 【发布时间】:2020-06-13 10:54:24 【问题描述】:

我有以下数据。我想要一个包含特定行和所有列的样本。数据包含超过 15 个国家/地区的信息。但是,我只想获得“南非”、“突尼斯”、“赞比亚”和“津巴布韦”的数据。这意味着我只想拥有这些行及其对应的列。我怎么做?

Case    CC3 Country Year    Banking Crisis  Banking_Crisis_Notes
4   AUS Australia   1800    0   
4   AUS Australia   1801    0   
4   AUS Australia   1802    0   
4   AUS Australia   1803    0   

【问题讨论】:

在这里查看答案:https://***.com/a/24821141 【参考方案1】:
exdf <- data.frame(country =rep(LETTERS[1:4], each = 4),
                   value = 1:16)
scountry <- c("A", "C")

# Using indexing
> exdf[exdf$country %in% scountry, ]
   country value
1        A     1
2        A     2
3        A     3
4        A     4
9        C     9
10       C    10
11       C    11
12       C    12

# Using subset function
> subset(exdf, country %in% scountry)
   country value
1        A     1
2        A     2
3        A     3
4        A     4
9        C     9
10       C    10
11       C    11
12       C    12

【讨论】:

【参考方案2】:

解决办法如下:

sample <- data[grep("South Africa|Tunisia|Zambia|Zimbabwe", data$Country), ]

【讨论】:

以上是关于使用 R 的样本数据 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

需要在R中生成5000个手段[重复]

R - 如何使用另一列的字符串集来过滤列[重复]

如何从Matlab中的数据集中选择随机样本[重复]

转录组差异分析流程三大R包比较

R语言中重复测量下的方差分析

R在向量重复函数中保持随机函数