如何在熊猫中对没有聚合功能的列进行分组?

Posted

技术标签:

【中文标题】如何在熊猫中对没有聚合功能的列进行分组?【英文标题】:how to group columns without aggregation function in pandas? 【发布时间】:2018-11-28 06:03:27 【问题描述】:

我有以下用 pyspark sql 编写的代码,如下所示:

dep_cus = sc_sql.sql("select cid, sum(trans_amnt) as run_bal, max(ds) as last_tran_date, mark_seg, province, local_body, branch, acc_type, int_rate from dep_sdf_temp group by cid, mark_seg, province, local_body, branch, acc_type, int_rate")

如何在 pandas 中编写这段代码?

【问题讨论】:

嗨,Subash,您能否编辑您的帖子以显示您在 pandas 中的尝试以及您遇到的问题? 【参考方案1】:

这就是你要找的吗?

dep_cus = dep_sdf_temp.groupby(['cid', 'mark_seg', 'province', 'local_body', 'branch', 'acc_type', 'int_rate'])
                      .agg('ds':'max', 'trans_amnt':'sum')
                      .rename(columns='ds':'last_tran_date', 'trans_amnt': 'run_bal') 

【讨论】:

以上是关于如何在熊猫中对没有聚合功能的列进行分组?的主要内容,如果未能解决你的问题,请参考以下文章

如何在熊猫 DataFrame 中对连续值进行分组

根据熊猫数据框中的列标签对数据进行分组

如何在 Promscale 的聚合查询中对标签进行分组

如何在 pyspark 中对需要在聚合中聚合的分组数据应用窗口函数?

如何通过 Eloquent 中具有多对多关系的外部表中的列聚合进行分组?

将分组的聚合唯一列添加到熊猫数据框