用另一列中的值替换缺失值

Posted

技术标签:

【中文标题】用另一列中的值替换缺失值【英文标题】:Replace missing values with a value from another column 【发布时间】:2016-03-22 10:14:52 【问题描述】:

如果我有:

s <- data.frame(ID=c(191, 282, 202, 210), Group=c("", "A", "", "B"), stringsAsFactors=FALSE)
s
   ID Group
1 191      
2 282     A
3 202      
4 210     B

我可以像这样用 N 替换空单元格:

ds$Group[ds$Group==""]<-"N"

s
   ID Group
1 191     N 
2 282     A
3 202     N
4 210     B

但我需要用另一列中的值替换空单元格。我怎样才能做到这一点?:

s
   ID Group Group2
1 191     D      D
2 282     A      G
3 202     G      G
4 210     B      D

【问题讨论】:

ds$Group[ds$Group==""] &lt;- ds$Group2[ds$Group==""] 相关帖子:***.com/questions/19253820ds$Group &lt;- coalesce2(ds$Group, ds$Group2) 【参考方案1】:

我们可以使用data.table将“Group2”中的值分配给“Group”,其中“Group”为“i”条件中指定的""

library(data.table)
setDT(s)[Group=="", Group:= Group2]

当分配发生时,它被认为是有效的。

【讨论】:

【参考方案2】:

ifelse(test, yes, no) 是一个方便的函数,它可以用于向量。使用你的最后一个 data.frame:

s <- data.frame(ID = c(191, 282, 202, 210),
    Group = c("", "A", "", "B"),
    Group2 = c("D", "G", "G", "D"))

s$Group <- ifelse(test = s$Group != "", yes = s$Group, no = s$Group2)

第一个参数是测试。对于向量中的每个值,如果test为真,则取yes中的值,否则取no中的值。

【讨论】:

以上是关于用另一列中的值替换缺失值的主要内容,如果未能解决你的问题,请参考以下文章

R数据框 - 用另一列的条件填充缺失值

Oracle - 用另一列中的值填充列中的空值

将 pandas 列中的值替换为缺失键的默认值

data.table::fread 不喜欢第一列中的缺失值

删除同一列或连续行的另一列中具有特定值和缺失值的行

使用 dplyr [重复] 有条件地将一列中的值替换为另一列中的值