使用 dplyr 复制一列并为 R 中的新列添加前缀

Posted

技术标签:

【中文标题】使用 dplyr 复制一列并为 R 中的新列添加前缀【英文标题】:Copy a column and add a prefix to new column in R with dplyr 【发布时间】:2016-12-02 10:12:53 【问题描述】:

有人知道如何复制data.frame 中的列并为新列添加前缀吗?

我们的想法是拥有一个包含数据帧的某些列名的字符向量,并使用前缀复制这些列名,以便随后执行操作。

原因是我想在这些列上使用扩展函数,但据我所知,扩展函数不会保留原始列。我想要什么:

来自具有以下列名称的 data.frame:

column_names <- c('var1', 'var2', 'var3')

到具有以下列的数据框

column_names <- c('var1', 'var2', 'var3', 'prefix_var1','prefix_var3')

带有“前缀”的列包含与其原始列相同的数据。

到目前为止我已经尝试过,其中部分成功了:

sel_columns <- c('var1', 'var3')

data <- data.frame(var1 = c(12,3,4), var2 = c(123,5435,121), var3 = c(23,456,123))

new_data <- data %>% mutate_at(one_of(sel_columns), funs(.))
#Error in eval(substitute(expr), envir, enclos) : 
#  could not find function "var1"
#In addition: Warning message:
#In one_of(sel_columns) : Unknown variables: `var1`, `var3`


new_data2 <- data %>% select(one_of(sel_columns)) %>% mutate_all(funs(prefix = . * 1)) %>% c(data, .) %>% data.frame

【问题讨论】:

【参考方案1】:

我们可以在base R试试这个

cbind(data, setNames(data[sel_columns], paste0("prefix_", sel_columns)))

#  var1 var2 var3 prefix_var1 prefix_var3
#1   12  123   23          12          23
#2    3 5435  456           3         456
#3    4  121  123           4         123

【讨论】:

我发现它确实适用于我提供的示例,但是对于我自己的示例,它产生了一个包含两列的 data.frame,一个名为“data”,另一个名为“V2” '。我发现使用 c() 函数 cbind() 函数确实可以正常工作。 @Michael 我不确定可能是什么问题。可以发dput(head(data)) 让我们得到真正的数据集吗? 如果您确实想添加 dplyr 风格:bind_cols(data, setNames(data[sel_columns], paste0("prefix_",sel_columns)))【参考方案2】:

我们可以使用data.table

library(data.table)
setDT(data)[, paste0("prefix_", sel_columns) := mget(sel_columns)][]
#   var1 var2 var3 prefix_var1 prefix_var3
#1:   12  123   23          12          23
#2:    3 5435  456           3         456
#3:    4  121  123           4         123

.SDcols

【讨论】:

【参考方案3】:

如果您真的想在dplyr 中执行此操作,您需要考虑使用dplyr 动词的标准评估版本。 @joel.wilson 有正确的想法,但如果您以编程方式执行此操作并使用管道,则 SE 版本是执行此操作的正确方法。

data %>% 
  bind_cols(., select_(., .dots = setNames(sel_columns, sprintf("prefix_%s", sel_columns)))) 

【讨论】:

以上是关于使用 dplyr 复制一列并为 R 中的新列添加前缀的主要内容,如果未能解决你的问题,请参考以下文章

使用 group by 汇总列并存储为 MySQL 中的新列(永久)

如何删除一列并创建一个新列而不是在 EF Core 中重命名?

R中的dplyr mutate - 添加列作为列的连接

Liquibase:将值从一列复制到具有数组数据类型的另一列

R - 创建几列非零最小值的新列

迭代数据框并根据一列的值在具有前一行值的新列中执行操作