如何通过使用数据框中的其他列来聚合熊猫数据框中的列

Posted

技术标签:

【中文标题】如何通过使用数据框中的其他列来聚合熊猫数据框中的列【英文标题】:How to aggregate a column in a pandas dataframe by using other columns in a dataframe 【发布时间】:2019-05-26 20:05:31 【问题描述】:

我有一个数据框,其中包含列 v、w、x、y、z 的重复记录。

V   W    X   Y   Z
a   US   1   0   88
a   US   0   1   88
a   US   2   0   88
a   RUS  1   2   23
b   IND  2   0   12
b   IND  1   3   12
b   RSA  0   1   5
c   BAN  5   6   10

我想通过聚合 X、Y 列从 V、W、Z 列中删除重复项。这将导致:

V   W    X    Y  Z
a   US   3    1  88   
a   RUS  1    2  23
b   IND  3    3  12
b   RSA  0    1  5
c   BAN  5    6  10

我不知道如何在 python 中这样做,请帮助我。

【问题讨论】:

【参考方案1】:

使用groupby.sum

df = df = df.groupby(['V','W','Z'], as_index=False, sort=False).sum()

print(df)
   V    W   Z  X  Y
0  a   US  88  3  1
1  a  RUS  23  1  2
2  b  IND  12  3  3
3  b  RSA   5  0  1
4  c  BAN  10  5  6

【讨论】:

以上是关于如何通过使用数据框中的其他列来聚合熊猫数据框中的列的主要内容,如果未能解决你的问题,请参考以下文章

如何使用嵌套字典列表展平熊猫数据框中的列

遍历熊猫数据框中的列

如何使用熊猫数据框中的列标记气泡图/散点图?

如何在 Pandas 数据框中的特定位置插入一列? (更改熊猫数据框中的列顺序)

如何同时对熊猫数据框中的列进行排序[重复]

确定熊猫数据框中的列值何时更改