熊猫数据框中的行排序和聚合
Posted
技术标签:
【中文标题】熊猫数据框中的行排序和聚合【英文标题】:row wise sorting in pandas dataframe and aggregation 【发布时间】:2017-04-01 23:01:06 【问题描述】:我在 pandas 数据框 df 中有一个表格
col1 col2 count
12 15 3
13 17 5
1 36 4
15 12 7
36 1 4
等等.... 我想要的是考虑像 '12 和 15' 和 '15 和 12' 这样的计算是相同的,并将它们的计数相加 并创建一个新的数据框 df2 其中没有重复的条目和要添加的计数。 例如。
col1 col2 count
12 15 10 #3+7
13 17 5
1 36 8 #4+4
等等。 我应该使用哪种方法来获得它? 提前致谢
【问题讨论】:
【参考方案1】:对行进行排序,然后分组和求和:
df[['a', 'b']] = df[['a', 'b']].apply(sorted, axis=1)
df.groupby(['a', 'b'], as_index=False)['c'].sum()
【讨论】:
即使我将轴更改为上午 1 点也没有得到正确的结果 是的,我发布的有点过早。给我几分钟。 see the snapshot of my current result以上是关于熊猫数据框中的行排序和聚合的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 groupby 和聚合将 pyspark 数据框中的行与多列连接起来