如何使用 purrr(管道、地图、imaps)将 df 或 tibble 中的两列组合绘制为 R 中的散点图
Posted
技术标签:
【中文标题】如何使用 purrr(管道、地图、imaps)将 df 或 tibble 中的两列组合绘制为 R 中的散点图【英文标题】:How can I plot two column combinations from a df or tibble as a scatterplot in R using purrr (pipes, maps, imaps) 【发布时间】:2021-08-31 12:39:06 【问题描述】:我正在尝试为列创建所有组合的散点图:insulin
、sspg
、glucose
(mclust,糖尿病数据集,在 R 中),类为 colo(u)r。我的意思是胰岛素加 sspg、胰岛素加葡萄糖和 sspg 加葡萄糖。
我想通过 tidyverse、purrr、映射和管道操作来做到这一点。我不能让它工作,因为我对 R 和函数式编程比较陌生。
当我加载数据时,我得到了以下列:类、葡萄糖、胰岛素和 sspg。我还使用pivot_longer
来获取列:attr 和 value,但我无法绘制它并且不知道如何创建组合。
我假设最后会有一个iwalk()
或map2()
函数,我可能不得不使用group_by()
和nest()
并且可能combn(., m=2)
用于组合或类似的东西。但它可能会有一些我自己看不到的更简单的解决方案。
我的尝试是这样的:
library(mclust)
library(dplyr)
library(tibble)
data(diabetes)
diabTib <- tibble::as_tibble(diabetes)
plot <- diabTib %>%
pivot_longer(cols = !c(class), names_to = "attr", values_to = "value") %>%
group_by(attr) %>%
nest()
最后,当我执行绘图或在管道期间作为副作用(?)时,屏幕上应该有三个绘图。
我们将不胜感激。
【问题讨论】:
这些会有帮助吗? ***.com/questions/56242195/… & ***.com/questions/54664092/… & ***.com/questions/50520885/… 【参考方案1】:您实际上可以通过 base::plot
轻松获得。
# load data
diabetes <- mclust::diabetes
# define vector of colors based on class in order of cases in dataset
colors <- c("Red", "Green", "Blue")[diabetes$class]
# make pair-wise scatter plot of desired variables colored based on class
plot(diabetes[,-1], col = colors)
由reprex package (v2.0.0) 于 2021-06-15 创建
【讨论】:
比我的解释简单多了!接受我的投票!【参考方案2】:library(mclust)
#> Package 'mclust' version 5.4.7
#> Type 'citation("mclust")' for citing this R package in publications.
library(tidyverse)
data("diabetes")
有很多方法可以做到这一点,我可能会从这种方式开始,因为它更容易理解,而且你得到的情节与组合一样多
tbl <- tibble::as_tibble(diabetes)
combn(setdiff(names(tbl),"class"),2, simplify = F) %>% #get combinations as vectors
map(~ggplot(tbl, aes_string(.x[[1]], .x[[2]], color = "class")) + geom_point())
#> [[1]]
#>
#> [[2]]
#>
#> [[3]]
如果您想在一个图中绘制所有组合,则需要tidyr
。
我就是这样计算的
tbl2 <- tbl %>%
pivot_longer(cols = -class, names_to = "attr", values_to = "value") %>%
nest_by(attr) %>%
d <- tidyr::expand(., V1 = attr, V2 = attr) # expand combinations
#rename the nested data to avoid naming conflicts
d <- left_join(d, mutate(., data = list(rename_with(data, .fn = ~paste0(.x,"_x")))), by = c("V1"="attr"))
d <- left_join(d, mutate(., data = list(rename_with(data, .fn = ~paste0(.x,"_y")))), by = c("V2"="attr"))
d
%>%
unnest(c(data.x, data.y))
ggplot(tbl2, aes(x = value_x, y = value_y, color = class_x)) +
geom_point() +
facet_grid(rows = vars(V1), cols = vars(V2))
由reprex package (v2.0.0) 于 2021-06-15 创建
【讨论】:
以上是关于如何使用 purrr(管道、地图、imaps)将 df 或 tibble 中的两列组合绘制为 R 中的散点图的主要内容,如果未能解决你的问题,请参考以下文章