如何获得按 numpy 和 pandas 中的变量分组的平均值? [复制]

Posted

技术标签:

【中文标题】如何获得按 numpy 和 pandas 中的变量分组的平均值? [复制]【英文标题】:How do I get an average grouped by a variable in numpy and pandas? [duplicate] 【发布时间】:2020-03-12 15:28:44 【问题描述】:

我有一个如下所示的数据框:

Year    Month    Day    Delay
2019    1        4      60
2018    1        10     50
2018    1        30     25
2019    1        16     42
2017    1        14     0
2019    1        16     9
2017    1        14     5

我想获得每个Year 的平均Delay

我想我需要使用groupby(),但我不知道如何对两个变量执行此操作。

在another solution 中,他们没有展示如何通过分组来获取变量。

【问题讨论】:

【参考方案1】:

IIUC,是mean吗?

df.groupby('Year').Delay.mean()

Out[126]:
Year
2017     2.5
2018    37.5
2019    37.0
Name: Delay, dtype: float64

【讨论】:

我只想要Delay的平均值 @rachelvsamuel:啊,我只编辑了mean 的答案Delay

以上是关于如何获得按 numpy 和 pandas 中的变量分组的平均值? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

如何检查变量是 python 列表、numpy 数组还是 pandas 系列

如何将 Pandas 查找表应用于 numpy 数组?

NumPy 版本的“指数加权移动平均线”,相当于 pandas.ewm().mean()

使用 NumPy 函数计算 Pandas 中的加权平均值

pandas numpy 如何简化多个矢量化函数参数

Pandas groupby agg - 如何获得计数?