根据R中的查找值将值分配给不同的列

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了根据R中的查找值将值分配给不同的列相关的知识,希望对你有一定的参考价值。

我正在尝试根据查找值为每行分别为不同的列分配值。我在R.工作。这是一个最小的工作示例:

#Item scores
item1 <- c(NA, 1, NA, 4)
item2 <- c(NA, 2, NA, 3)
item3 <- c(NA, 3, NA, NA)
item57 <- c(NA, 4, 4, 1)

mydata <- data.frame(item1, item2, item3, item57)

#Lookup values based on item score
lookup <- data.frame(score = 1:4, value=c(6, 7, 8, 10))

我有许多参与者(即行),在许多项目(即列)中的每一项上评分。我想在数据框中为与项目分数相关的值创建变量(基于查找表)。这是我想要的输出:

#Desired output (adding value that is tied to item score to the original data)
desiredOutput <- cbind(mydata,
                   value1 = c(NA, 6, NA, 10),
                   value2 = c(NA, 7, NA, 8),
                   value3 = c(NA, 8, NA, NA),
                   value57 = c(NA, 10, 10, 6))

我有一个相当大的数据集,如果可能的话,我希望远离循环。此外,如果处理速度更快,我们可以跳过包含所有NA的行。

答案

这是一个整齐的方法。它的基础是你想首先gather得分列和left_join查找表,以便你的值与分数匹配。然后剩下的就是操作以回到所需的输出格式。要做到这一点,我们需要使用gatherunite创建我们想要的列名,然后最后spread退出。请注意,您需要在开头使用rowid_to_column,以便spread知道要在哪些行上放置哪些观察结果。如果您想要准确获取输出列名称,可以混合使用一些stringr

item1 <- c(NA, 1, NA, 4)
item2 <- c(NA, 2, NA, 3)
item3 <- c(NA, 3, NA, NA)
item57 <- c(NA, 4, 4, 1)

mydata <- data.frame(item1, item2, item3, item57)

#Lookup values based on item score
lookup <- data.frame(score = 1:4, value=c(6, 7, 8, 10))

library(tidyverse)
mydata %>%
  rowid_to_column(var = "participant") %>%
  gather(items, score, starts_with("item")) %>%
  left_join(lookup) %>%
  gather(coltype, val, score:value) %>%
  unite(colname, coltype, items) %>%
  spread(colname, val)
#> Joining, by = "score"
#>   participant score_item1 score_item2 score_item3 score_item57 value_item1
#> 1           1          NA          NA          NA           NA          NA
#> 2           2           1           2           3            4           6
#> 3           3          NA          NA          NA            4          NA
#> 4           4           4           3          NA            1          10
#>   value_item2 value_item3 value_item57
#> 1          NA          NA           NA
#> 2           7           8           10
#> 3          NA          NA           10
#> 4           8          NA            6

reprex package创建于2018-06-19(v0.2.0)。

以上是关于根据R中的查找值将值分配给不同的列的主要内容,如果未能解决你的问题,请参考以下文章

根据带有if条件的多个文本框值将值分配给表单上的文本框-MS ACCESS

R:将值分配给数据框中的动态变量时遇到问题

根据查找值将值从一张表匹配并粘贴到另一张表中

如何根据 azure databricks 中的列值将静态值传递给动态值

将值分配给由字符串名称动态确定的淘汰赛 observable

如何将值向量分配给R中igraph中的顶点标签?