如何在函数内使用 R 字符向量元素作为字符串和变量?

Posted

技术标签:

【中文标题】如何在函数内使用 R 字符向量元素作为字符串和变量?【英文标题】:How to use R character vector element as string and variable inside function? 【发布时间】:2021-03-31 03:23:52 【问题描述】:

我正在尝试将 SPSS 样式类别标签应用于我在 R 中的数据集。我认为我的问题出现了,因为我不知道如何正确解析变量,因此不一定与这些类型的数据相关。 首先,按照expss 库文档手动执行此操作可以正常工作:

library(expss)

#Load in the data
data(mtcars)

#Apply Variable Labels and Value Labels (and Numeric Coding) to each Variable.
mtcars = apply_labels(mtcars,
                      vs = "Engine",
                      vs = c("V-engine" = 1,
                             "Straight engine" = 2,
                             "Other engine" = 3)
)

如果我将“变量名称”、“变量标签”、“值标签”和相应的“值数字代码”存储在某些 R 数据类型中,并且我尝试在 apply_labels 函数中使用它们,我的问题就会出现.例如,如果我将这些存储在字符向量中,如下所示:

#Load in the data
data(mtcars)

#Value Labels
value_lab<-c("V-engine","Straight engine","Other engine")
#Value's Numeric coding
value_num<-c("1","2","3")

#Variable names
var <- c("vs")
#Variable Labels
var_lab<-c("Engine")

那么我的问题是,我将如何在apply_labels 函数中使用我的字符向量元素?例如我该怎么做这样的事情:

#Apply Variable Labels and Value Labels (and Numeric Coding) to each Variable.
mtcars = apply_labels(mtcars,
                      var[1] = var_lab[1],
                      var[1] = c(value_lab[1] = value_num[1],
                                 value_lab[2] = value_num[2],
                                 value_lab[3] = value_num[3])
)

我尝试了pastetoString 的各种组合,但均未成功。我的下一步是将其应用于我的 500,000+ 行 x 20,000 列数据,其中可能的值标签/数字编码数量待定。 必修课:我是 R 新手。 谢谢。

【问题讨论】:

【参考方案1】:

为了达到你想要的结果

    利用命名列表和向量来存储变量和值标签 这样做可以利用do.call 将变量和值标签传递给apply_labels

为了使示例更有趣,我为第二个变量添加了标签。

library(expss)

# Variable Labels
var_labels <- list(vs = "Engine", am = "Transmission")
#Value Labels
val_labels <- list(
  vs = c("V-engine" = 0, "Straight engine" = 1),
  am = c("Automatic" = 0, "Manual" = 1)
)

mtcars2 <- do.call(apply_labels, c(list(data = mtcars), var_labels, val_labels))

table(mtcars2$am, mtcars2$vs)
#>            
#>             V-engine Straight engine
#>   Automatic       12               7
#>   Manual           6               7

【讨论】:

【参考方案2】:

太好了,谢谢!这使我了解了命名列表并使用setNames 构建了一个解决方案。

我最终没有使用expss。它似乎在 R 中工作并按预期标记了所有内容,但是当我使用 haven::write_sav 将最终数据帧从 R 导出到 SPSS 时,值标签没有被维护(但变量标签是)。

我使用haven 标记的矢量类 来应用变量和值标签。我的最终解决方案如下所示:

#Load in the data
data(mtcars)

#Variables
var <- c("vs")
#Variable Labels
var_labels<-c("Engine")

#Value Labels (for first Variable)
value_labs<-c("V-engine","Straight engine","Other engine")
#Value's Numeric coding )
value_num<-c("1","2","3")

#Make a named list to use as the value labels
value_labels <- setNames(as.integer(value_num),value_labs)

#Apply the label with haven
mtcars[,c(var[1])]<-labelled(mtcars[, c(var[1])],
                              labels=value_labels,
                              label=var_labels[1])

#Save out in spss format
haven::write_sav(mtcars, "test.sav")

另外,我已经进行了设置,因此我的数据一次包含一组值标签,但是您扩展到第二个变量的示例也帮助我概括了这一点,再次感谢!

【讨论】:

以上是关于如何在函数内使用 R 字符向量元素作为字符串和变量?的主要内容,如果未能解决你的问题,请参考以下文章

R从字符向量输入名称到函数公式语句

R语言列表list函数

R语言 列表

如何在自定义 R 函数中使用文本字符串作为变量

如何在 R 中使用 apply 将字符串粘贴到字符串向量的每个元素上?

R语言中向量的定义以及基本操作