按列值将数据框拆分为两个[重复]

Posted

技术标签:

【中文标题】按列值将数据框拆分为两个[重复]【英文标题】:split data frame into two by column value [duplicate] 【发布时间】:2022-01-19 21:16:09 【问题描述】:

我在 R 中有一个数据框,其中一列是gendergender 的值是带有“f”或“m”的因子,但如果数据集不好,它可能会更多(例如 NA)。

我正在尝试将数据框拆分为具有唯一性别的数据框列表。这样我就可以在不同的人群上运行相同的模型。

基本上有没有更好的方法:

dfMale <- mydata[which(mydata$gender == "m"),]
dfFemale <- mdata[which(mydata$gender == "f"),]
dfOther <- mydata[!(1:dim(mydata][1] %in% c(which(mydata$gender == "m"),which(mydata$gender == "f"))]

谢谢。

【问题讨论】:

函数子集或拆分有很多。 【参考方案1】:
X<-split(df, df$gender)

从这个问题

Split data.frame based on levels of a factor into new data.frames

【讨论】:

以上是关于按列值将数据框拆分为两个[重复]的主要内容,如果未能解决你的问题,请参考以下文章

sh 按列值拆分CSV

如何在 Pandas 数据框中按列值分组

数据框按列值过滤行

按列值对 R 数据框进行子集,并将与特定值匹配的单元格更改为新值

Python/Pandas - 按列值删除重复行

Spark partitionBy |按列值而不是 columnName=value 保存