自动递增到 case_when 或替换循环
Posted
技术标签:
【中文标题】自动递增到 case_when 或替换循环【英文标题】:increment automatic to case_when or substitute of loops 【发布时间】:2022-01-20 06:47:11 【问题描述】:我收到数据帧,但列数 (V) 定期增加(实际上是 V49)。此示例仅采用 V1 到 V7。我有很多 Nas 和其他 3 个列 ID、REP 以及所有下一步使用的列。
ID <- c("A", "B", "B3", "E4", "JE5", "L6")
V1 <- c(3, 5, 1, 3, 7, 1)
V2 <- c(6, 4, 2, 7, 6, 2)
V3 <- c(6, 5, 2, 7, 6, 3)
V4 <- c(6, 7, 1, 7, 6, 3)
V5 <- c(NA, NA, 2, 7, NA, 3)
V6 <- c(NA, NA, 2, 7, NA, 3)
V7 <- c(NA, NA, NA, 7, NA, 3)
REP <- c(4, 4, 6, 7, 4, 7)
all <- c(6, 5, 2, 7, 6, 3)
variation <- c(0, 0, 0, 0, 0, 0)
df <- data.frame(ID, V1, V2, V3, V4, V5, V6, V7, REP, all, variation)
我想要这个结果:在Vi+1 - Vi < 0 or > 1
时添加variation == 2
。i = V1
到Vmax
:Vmax
对于每个人V4
都不同A
和B
V6
在B3
....
# ID V1 V2 V3 V4 V5 V6 V7 REP all variation
# 1 A 3 6 6 6 NA NA NA 4 6 0
# 2 B 5 4 5 7 NA NA NA 4 5 0
# 3 B3 1 2 2 1 2 2 NA 6 2 0
# 4 E4 3 7 7 7 7 7 7 7 7 0
# 5 JE5 7 6 6 6 NA NA NA 4 6 0
# 6 L6 1 2 3 3 3 3 3 7 3 0
我尝试使用循环,但它需要很长时间,所以我尝试使用case_when()
。这是可行的,但每周我都需要添加新行,因为我想查看变量 Vi
和 Vi+1
之间何时存在变化。
!between(Vi+1 - Vi, 0, 1) ~ 2,....
df <- df %>%
mutate(variation = case_when(
!between(V2 - V1, 0, 1) ~ 2,
!between(V3 - V2, 0, 1) ~ 2,
!between(V4 - V3, 0, 1) ~ 2,
!between(V5 - V4, 0, 1) ~ 2,
!between(V6 - V5, 0, 1) ~ 2,
!between(V7 - V6, 0, 1) ~ 2,
TRUE ~ as.numeric(variation)))
case_when
或 apply
或 map
的其他函数是否有自动递增以避免手动写入所有变量
提前谢谢你。
【问题讨论】:
【参考方案1】:我会将数据转换为更长的格式,然后在单个语句中将所有值与其滞后时间进行比较。
df %>%
pivot_longer(matches("V[0-9]+")) %>%
group_by(ID) %>%
summarize(variation = if (any(!between(value - lag(value), 0, 1), na.rm = T)) 2 else unique(variation)) %>%
right_join(select(df, -variation), by = "ID")
#> # A tibble: 6 × 11
#> ID variation V1 V2 V3 V4 V5 V6 V7 REP all
#> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 A 2 3 6 6 6 NA NA NA 4 6
#> 2 B 2 5 4 5 7 NA NA NA 4 5
#> 3 B3 2 1 2 2 1 2 2 NA 6 2
#> 4 E4 2 3 7 7 7 7 7 7 7 7
#> 5 JE5 2 7 6 6 6 NA NA NA 4 6
#> 6 L6 0 1 2 3 3 3 3 3 7 3
【讨论】:
以上是关于自动递增到 case_when 或替换循环的主要内容,如果未能解决你的问题,请参考以下文章