子集几个与R中的分类变量不同的[重复]

Posted 2023-02-14

技术标签:

【中文标题】子集几个与R中的分类变量不同的[重复]【英文标题】：Subsetting several different from a categorical variable in R [duplicate] 【发布时间】：2022-01-01 02:59:20 【问题描述】：

我有一个任务，我需要在 R 中的 iris 数据集上使用 subset() 函数。具体来说，我必须只使用三个 Species 变量中的两个，setosa、virginica、versicolor。不知何故，如果我尝试制作一个只有 setosa 和 virginica 的新数据框，我无法让子集函数选择其中一个以上。如何对多个分类变量进行子集化？

非常感谢您的帮助。

【问题讨论】：

这能回答你的问题吗？ Getting rows given multiple values of a column in R 是的，绝对是重复的 【参考方案1】：

尝试使用%in% 关键字：

library(datasets)
data(iris)
subset(iris, iris$Species %in% c("setosa", "versicolor"))

【讨论】：

谢谢，太好了！我想我没有用正确的方式写出来。真的很感激。 :)【参考方案2】：

您可以编写一个子集，在其中从变量名称“物种”中指定您想要的物种

dfSetosaVirginica <- subset(iris , Species %in% c("setosa","virginica"))

【讨论】：

谢谢，它有效！这很有效率，再次感谢！

以上是关于子集几个与R中的分类变量不同的[重复]的主要内容，如果未能解决你的问题，请参考以下文章

在 R [重复] 中更改 glm 中的分类预测变量的级别

如何避免循环遍历 pandas 中的分类变量以查看/操作数据帧切片/子集

如何网格化面板图，使其在 R 中的 ggplot 中具有分类变量和不同的 x 变量

R randomForest子集无法摆脱因子水平[重复]

R：基于分类变量*列表*创建虚拟变量[重复]

当通过R中的不同变量进行分组和汇总时，计算分类变量的出现次数