用另一列中的值替换缺失值
Posted
技术标签:
【中文标题】用另一列中的值替换缺失值【英文标题】:Replace missing values with a value from another column 【发布时间】:2016-03-22 10:14:52 【问题描述】:如果我有:
s <- data.frame(ID=c(191, 282, 202, 210), Group=c("", "A", "", "B"), stringsAsFactors=FALSE)
s
ID Group
1 191
2 282 A
3 202
4 210 B
我可以像这样用 N 替换空单元格:
ds$Group[ds$Group==""]<-"N"
s
ID Group
1 191 N
2 282 A
3 202 N
4 210 B
但我需要用另一列中的值替换空单元格。我怎样才能做到这一点?:
s
ID Group Group2
1 191 D D
2 282 A G
3 202 G G
4 210 B D
【问题讨论】:
ds$Group[ds$Group==""] <- ds$Group2[ds$Group==""]
相关帖子:***.com/questions/19253820ds$Group <- coalesce2(ds$Group, ds$Group2)
【参考方案1】:
我们可以使用data.table
将“Group2”中的值分配给“Group”,其中“Group”为“i”条件中指定的""
。
library(data.table)
setDT(s)[Group=="", Group:= Group2]
当分配发生时,它被认为是有效的。
【讨论】:
【参考方案2】:ifelse(test, yes, no)
是一个方便的函数,它可以用于向量。使用你的最后一个 data.frame:
s <- data.frame(ID = c(191, 282, 202, 210),
Group = c("", "A", "", "B"),
Group2 = c("D", "G", "G", "D"))
s$Group <- ifelse(test = s$Group != "", yes = s$Group, no = s$Group2)
第一个参数是测试。对于向量中的每个值,如果test
为真,则取yes
中的值,否则取no
中的值。
【讨论】:
以上是关于用另一列中的值替换缺失值的主要内容,如果未能解决你的问题,请参考以下文章