Pandas详解聚合运算agg()
Posted ZSYL
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas详解聚合运算agg()相关的知识,希望对你有一定的参考价值。
聚合运算
前言
在数据分析中,分组聚合二者缺一不可。对数据聚合(求和、平均值等)通常是不可避免的。pd.agg()
很方便进行聚合操作。
1. 创建DataFrame对象
import pandas as pd
df1 = pd.DataFrame({'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]})
grouped = df1.groupby(['sex','smoker'])
# sex有 F M 二值,smoker有 Y N 二值,故分成四组。
2. 单列聚合
grouped['age'].agg('mean')
sex smoker
F N 30.0
Y 28.0
M N 40.0
Y 17.5
Name: age, dtype: float64
3. 多列聚合
grouped.agg('mean')
4. 多种聚合运算
grouped['age'].agg(['min','max'])
5. 多种聚合运算并更改列名
grouped['age'].agg([('A','mean'),('B','max')])
6. 不同的列运用不同的聚合函数
grouped.agg({'age':['sum','mean'], 'weight':['min','max']})
7. 使用自定义的聚合函数
def Max_cut_Min(group):
return group.max()-group.min()
grouped.agg(Max_cut_Min)
8. 方便的descibe
grouped.describe()
参考博客:link
加油!
感谢!
努力!
以上是关于Pandas详解聚合运算agg()的主要内容,如果未能解决你的问题,请参考以下文章
pandas dataframe数据聚合groupbyaggprivot基于sum统计详解及实例
pandas使用groupby函数基于指定分组变量对dataframe数据进行分组使用agg函数计算每个分组不同数值变量的聚合统计值agg参数为字典指定不同变量的聚合计算统计量的形式
pandas使用groupby函数agg函数获取每个分组聚合对应的均值(mean)实战:计算分组聚合单数据列的均值计算分组聚合多数据列的均值