Pandas实现groupby分组聚合后不同列数据统计

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas实现groupby分组聚合后不同列数据统计相关的知识,希望对你有一定的参考价值。

参考技术A

电影评分数据集(UserID,MovieID,Rating,Timestamp)

聚合后单列-单指标统计:每个MovieID的平均评分

聚合后单列-多指标统计:每个MoiveID的最高评分、最低评分、平均评分

聚合后多列-多指标统计:每个MoiveID的评分人数,最高评分、最低评分、平均评分

记忆:agg(新列名=函数)、agg(新列名=(原列名,函数))、agg("原列名":函数/列表)
agg函数的两种形式,等号代表“把结果赋值给新列”,字典/元组代表“对这个列运用这些函数”

每个MoiveID的评分人数,最高评分、最低评分、平均评分

每个MoiveID的评分人数,最高评分、最低评分、平均评分

pandas使用groupby函数基于指定分组变量对dataframe数据进行分组使用agg函数计算每个分组不同数值变量的聚合统计值agg参数为字典指定不同变量的聚合计算统计量的形式

pandas使用groupby函数基于指定分组变量对dataframe数据进行分组、使用agg函数计算每个分组不同数值变量的聚合统计值、agg参数为字典指定不同变量的聚合计算统计量的形式(最大值、最小值、均值、中位数、加和、计数等)

以上是关于Pandas实现groupby分组聚合后不同列数据统计的主要内容,如果未能解决你的问题,请参考以下文章

pandas使用groupby函数agg函数获取每个分组聚合对应的均值(mean)实战:计算分组聚合单数据列的均值计算分组聚合多数据列的均值

pandas使用groupby函数agg函数获取每个分组聚合对应的标准差(std)实战:计算分组聚合单数据列的标准差(std)计算分组聚合多数据列的标准差(std)

python--pandas分组聚合

pandas编写自定义函数计算多个数据列的加和(sum)使用groupby函数和apply函数聚合计算分组内多个数据列的加和

pandas数据分组

pandas使用groupby函数基于指定分组变量对dataframe数据进行分组使用agg函数计算每个分组不同数值变量的聚合统计值agg参数为字典指定不同变量的聚合计算统计量的形式