如何在熊猫中对没有聚合功能的列进行分组?
Posted
技术标签:
【中文标题】如何在熊猫中对没有聚合功能的列进行分组?【英文标题】:how to group columns without aggregation function in pandas? 【发布时间】:2018-11-28 06:03:27 【问题描述】:我有以下用 pyspark sql 编写的代码,如下所示:
dep_cus = sc_sql.sql("select cid, sum(trans_amnt) as run_bal, max(ds) as last_tran_date, mark_seg, province, local_body, branch, acc_type, int_rate from dep_sdf_temp group by cid, mark_seg, province, local_body, branch, acc_type, int_rate")
如何在 pandas 中编写这段代码?
【问题讨论】:
嗨,Subash,您能否编辑您的帖子以显示您在 pandas 中的尝试以及您遇到的问题? 【参考方案1】:这就是你要找的吗?
dep_cus = dep_sdf_temp.groupby(['cid', 'mark_seg', 'province', 'local_body', 'branch', 'acc_type', 'int_rate'])
.agg('ds':'max', 'trans_amnt':'sum')
.rename(columns='ds':'last_tran_date', 'trans_amnt': 'run_bal')
【讨论】:
以上是关于如何在熊猫中对没有聚合功能的列进行分组?的主要内容,如果未能解决你的问题,请参考以下文章
如何在 pyspark 中对需要在聚合中聚合的分组数据应用窗口函数?