如何根据组对一列数据求和

Posted

技术标签:

【中文标题】如何根据组对一列数据求和【英文标题】:How to Sum a column of data based on their group 【发布时间】:2022-01-22 21:35:55 【问题描述】:

我对 R 非常陌生,我正在接受评估,但我真的很难理解它,如果我使用了错误的行话等,非常抱歉。

我得到了一张数据表,其中包含我特别关注的列:“国家”、“大陆”和“People_Fully_Vaccinated”。在此数据中,我想根据他们的大陆将“People_Fully_Vaccinated”的数量相加以转换为图表,但是我无法根据他们的大陆对国家进行分组以结合接种疫苗的人数。我的列似乎没有被识别为对象,但我不确定如何将一整列数字分配给对象。

如果我以一种令人困惑的方式写了这篇文章,我很抱歉 - 任何帮助将不胜感激。

【问题讨论】:

【参考方案1】:

这个dplyr 方法怎么样?

玩具数据:

df <- data.frame(
  Continent = c("A", "A", "B", "B"),
  Ppl_fully_vaccinated = c(1000, 2555, 33, 44)
)

方法:

library(dplyr)
df %>% 
  group_by(Continent) %>%
  summarise(Total = sum(Ppl_fully_vaccinated))
# A tibble: 2 × 2
  Continent Total
  <chr>     <dbl>
1 A          3555
2 B            77

【讨论】:

嗨,克里斯,感谢您的回复。当您写: Ppl_fully_vaccinated=c(1000,2555,33,44) 时,这些数字代表什么?抱歉,我知道这将是一个非常新的愚蠢问题!

以上是关于如何根据组对一列数据求和的主要内容,如果未能解决你的问题,请参考以下文章

如何按组对变量求和

如何按组对变量求和

Pyspark数据框:对一列求和,同时对另一列进行分组

根据具有标准的组对连续月份求和

excel怎么对一列进行求和

如何按组对变量求和