熊猫数据框中的行排序和聚合

Posted

技术标签:

【中文标题】熊猫数据框中的行排序和聚合【英文标题】:row wise sorting in pandas dataframe and aggregation 【发布时间】:2017-04-01 23:01:06 【问题描述】:

我在 pandas 数据框 df 中有一个表格

col1    col2     count
12       15        3
13       17        5
1        36        4
15       12        7
36       1         4

等等.... 我想要的是考虑像 '12 和 15' 和 '15 和 12' 这样的计算是相同的,并将它们的计数相加 并创建一个新的数据框 df2 其中没有重复的条目和要添加的计数。 例如。

col1    col2     count
12       15        10     #3+7
13       17        5
1        36        8       #4+4 

等等。 我应该使用哪种方法来获得它? 提前致谢

【问题讨论】:

【参考方案1】:

对行进行排序,然后分组和求和:

df[['a', 'b']] = df[['a', 'b']].apply(sorted, axis=1)
df.groupby(['a', 'b'], as_index=False)['c'].sum()

【讨论】:

即使我将轴更改为上午 1 点也没有得到正确的结果 是的,我发布的有点过早。给我几分钟。 see the snapshot of my current result

以上是关于熊猫数据框中的行排序和聚合的主要内容,如果未能解决你的问题,请参考以下文章

如何根据列中的最新日期聚合 pandas 数据框中的行?

如何使用 groupby 和聚合将 pyspark 数据框中的行与多列连接起来

根据熊猫数据框中的列标签对数据进行分组

有没有办法在聚合调用中不使用 ORDER BY 对 postgresql 自定义聚合中的行进行预排序?

Python Pandas数据框中的行排序/计数

比较熊猫数据框中的行值