R按四分位数表示的多个组的平均值[重复]

Posted

技术标签:

【中文标题】R按四分位数表示的多个组的平均值[重复]【英文标题】:R Mean of multiple groups by quartiles [duplicate] 【发布时间】:2021-10-17 19:33:57 【问题描述】:

我有一个包含不同变量的数据框,例如:x1、x2 等。 我使用以下代码基于一个变量 (BE) 创建了四分位数:

Quantile_Var <- Var%>% mutate(Quartile = ntile(BE, 5))

现在我想按四分位数查看每个变量 (x1, x2...) 的均值。我尝试使用以下代码,但它给了我太多信息,因为我只需要手段。如何编辑代码,让 R 只给我手段?

Quantile_Testvar %>% split(.$quartile) %>% map(summary)`

这可能很容易,不幸的是我很难做到这一点

【问题讨论】:

【参考方案1】:

您可以将ntile 的输出作为一个组使用,并获得所有x 变量的平均值。

library(dplyr)

Quantile_Var <- Var %>% 
                  group_by(Quartile = ntile(BE, 5)) %>%
                  summarise(across(starts_with('x'), mean, na.rm = TRUE))

【讨论】:

完美运行

以上是关于R按四分位数表示的多个组的平均值[重复]的主要内容,如果未能解决你的问题,请参考以下文章

平均数 中位数 四分位数 方差 标准差

特征工程之缺失值与离群值处理

pandas使用

箱型图

分位数(quantile)

箱线图(boxplot)简介与举例