子集几个与R中的分类变量不同的[重复]
Posted
技术标签:
【中文标题】子集几个与R中的分类变量不同的[重复]【英文标题】:Subsetting several different from a categorical variable in R [duplicate] 【发布时间】:2022-01-01 02:59:20 【问题描述】:我有一个任务,我需要在 R 中的 iris 数据集上使用 subset() 函数。具体来说,我必须只使用三个 Species 变量中的两个,setosa、virginica、versicolor。 不知何故,如果我尝试制作一个只有 setosa 和 virginica 的新数据框,我无法让子集函数选择其中一个以上。如何对多个分类变量进行子集化?
非常感谢您的帮助。
【问题讨论】:
这能回答你的问题吗? Getting rows given multiple values of a column in R 是的,绝对是重复的 【参考方案1】:尝试使用%in%
关键字:
library(datasets)
data(iris)
subset(iris, iris$Species %in% c("setosa", "versicolor"))
【讨论】:
谢谢,太好了!我想我没有用正确的方式写出来。真的很感激。 :)【参考方案2】:您可以编写一个子集,在其中从变量名称“物种”中指定您想要的物种
dfSetosaVirginica <- subset(iris , Species %in% c("setosa","virginica"))
【讨论】:
谢谢,它有效!这很有效率,再次感谢!以上是关于子集几个与R中的分类变量不同的[重复]的主要内容,如果未能解决你的问题,请参考以下文章
如何避免循环遍历 pandas 中的分类变量以查看/操作数据帧切片/子集