groupby+(apply+agg+transform)方法的比较

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了groupby+(apply+agg+transform)方法的比较相关的知识,希望对你有一定的参考价值。

groupby+(apply+agg+transform)方法的比较

 

分组函数groupby+(apply+agg+transform)方法的比较

pandas模块给数据处理的能力给予了很大的助力,但是初学者刚开始可能会被其中分组聚合的三个方法(apply,agg和transform),弄的头晕眼花,至少我自己学习的过程中是这样的,看了网上的很多解释,觉得对于初学者理解起来还是蛮困难的,翻阅了好几本python数据分析的书籍,自己总算理解了个大概,在这里给大家讲一下这三个方法。

具体请看《Python数据科学手册》(Jake Vanderplas著)的146页哈,另外这本书强烈推荐,看过Wes McKinney著的《利用Python进行数据分析》,再看这本书,很多概念会有一种恍然大悟的感觉。

简单的说,agg,transform和apply三个方法的输入对象,都是分组后的DataFrame/Series,区别在于,他们的输出类型不一样,agg输出的是缩减后的标量(或者标量列表);transform输出的是原输入的DataFrame大小的,但是数据元

以上是关于groupby+(apply+agg+transform)方法的比较的主要内容,如果未能解决你的问题,请参考以下文章

pandas agg 和 apply 函数有啥区别?

groupby()函数

pandas中apply和transform方法的性能比较

DataFrame --- join / groupBy-agg - 分区

python pandas, DF.groupby().agg(), agg() 中的列引用

Pandas groupby agg - 如何获得计数?