子集几个与R中的分类变量不同的[重复]

Posted

技术标签:

【中文标题】子集几个与R中的分类变量不同的[重复]【英文标题】:Subsetting several different from a categorical variable in R [duplicate] 【发布时间】:2022-01-01 02:59:20 【问题描述】:

我有一个任务,我需要在 R 中的 iris 数据集上使用 subset() 函数。具体来说,我必须只使用三个 Species 变量中的两个,setosa、virginica、versicolor。 不知何故,如果我尝试制作一个只有 setosa 和 virginica 的新数据框,我无法让子集函数选择其中一个以上。如何对多个分类变量进行子集化?

非常感谢您的帮助。

【问题讨论】:

这能回答你的问题吗? Getting rows given multiple values of a column in R 是的,绝对是重复的 【参考方案1】:

尝试使用%in% 关键字:

library(datasets)
data(iris)
subset(iris, iris$Species %in% c("setosa", "versicolor"))

【讨论】:

谢谢,太好了!我想我没有用正确的方式写出来。真的很感激。 :)【参考方案2】:

您可以编写一个子集,在其中从变量名称“物种”中指定您想要的物种

dfSetosaVirginica <- subset(iris , Species %in% c("setosa","virginica"))

【讨论】:

谢谢,它有效!这很有效率,再次感谢!

以上是关于子集几个与R中的分类变量不同的[重复]的主要内容,如果未能解决你的问题,请参考以下文章

在 R [重复] 中更改 glm 中的分类预测变量的级别

如何避免循环遍历 pandas 中的分类变量以查看/操作数据帧切片/子集

如何网格化面板图,使其在 R 中的 ggplot 中具有分类变量和不同的 x 变量

R randomForest子集无法摆脱因子水平[重复]

R:基于分类变量*列表*创建虚拟变量[重复]

当通过R中的不同变量进行分组和汇总时,计算分类变量的出现次数