如何使用“命名聚合” [重复]
Posted
技术标签:
【中文标题】如何使用“命名聚合” [重复]【英文标题】:How to use "Named aggregation" [duplicate] 【发布时间】:2019-11-29 08:15:31 【问题描述】:我想在 pandas DataFrameGroupBy 的同一列上应用两个不同的聚合并命名新列。
我已尝试使用文档中显示的内容。 https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html#named-aggregation
In [82]: animals.groupby("kind").agg( ....: min_height=('height', 'min'), ....: max_height=('height', 'max'), ....: average_weight=('weight', np.mean), ....: ) ....: Out[82]: min_height max_height average_weight kind cat 9.1 9.5 8.90 dog 6.0 34.0 102.75
我想做的事情是:
df = pd.DataFrame("year": [2001, 2001, 2001, 2005, 2005],
"value": [1, 2, 5, 3, 1])
df = df.groupby("year").agg(sum=('value', 'sum'),
count=('value', 'size'))
但是,这给出了以下内容:
TypeError: aggregate() missing 1 required positional argument: 'arg'
【问题讨论】:
我在命名聚合here. 上写了一个非常详细的答案@您实际上是在问如何在同一列上使用多个函数进行聚合。 是的,我在发布这个问题之前阅读了你的帖子,而且我最近刚刚安装了 pandas,所以我认为我有最新的版本。我重新安装到 0.25.0,当然,它现在可以工作了。 【参考方案1】:由于一列需要两个 aggfunction,因此您可能需要传递给列表,例如当您没有将 pandas
更新为 0.25.0 时
df = df.groupby("year").value.agg(['sum','count'])
df
sum count
year
2001 8 3
2005 4 2
在pandas
0.25.0
pd.__version__
'0.25.0'
df = df.groupby("year").agg(sum=('value', 'sum'),
count=('value', 'count'))
df
sum count
year
2001 8 3
2005 4 2
【讨论】:
我刚刚安装了 pandas,所以我认为我拥有的是最新版本。我重新安装到 0.25.0,当然,它现在可以工作了。以上是关于如何使用“命名聚合” [重复]的主要内容,如果未能解决你的问题,请参考以下文章
Pandas 命名聚合语法抛出错误 TypeError: int() argument must be a string, a bytes-like object or a number, not '