将组平均值分配给python / pandas中的每一行

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了将组平均值分配给python / pandas中的每一行相关的知识,希望对你有一定的参考价值。

我有一个数据框,我希望根据商店和所有商店计算平均值。我创建了计算平均值的代码,但我正在寻找一种更有效的方法。

DF

Cashier#     Store#     Sales    Refunds
001          001        100      1
002          001        150      2
003          001        200      2
004          002        400      1
005          002        600      4

DF-期望

Cashier#     Store#     Sales    Refunds     Sales_StoreAvg    Sales_All_Stores_Avg
001          001        100      1            150               290
002          001        150      2            150               290
003          001        200      2            150               290
004          002        400      1            500               290
005          002        600      4            500               290

我的尝试我创建了两个额外的数据帧,然后进行了左连接

df.groupby(['Store#']).sum().reset_index().groupby('Sales').mean() 
答案

我认为需要GroupBy.transformmean的聚合值填充的新列:

df['Sales_StoreAvg'] = df.groupby('Store#')['Sales'].transform('mean')
df['Sales_All_Stores_Avg'] = df['Sales'].mean()
print (df)
   Cashier#  Store#  Sales  Refunds  Sales_StoreAvg  Sales_All_Stores_Avg
0         1       1    100        1             150                 290.0
1         2       1    150        2             150                 290.0
2         3       1    200        2             150                 290.0
3         4       2    400        1             500                 290.0
4         5       2    600        4             500                 290.0
另一答案

使用这个,与transformassign

df.assign(Sales_StoreAvg = df.groupby('Store#')['Sales'].transform('mean'),
          Sales_All_Stores_Avg = df['Sales'].mean()).astype(int)

输出:

   Cashier#  Store#  Sales  Refunds  Sales_All_Stores_Avg  Sales_StoreAvg
0         1       1    100        1                   290             150
1         2       1    150        2                   290             150
2         3       1    200        2                   290             150
3         4       2    400        1                   290             500
4         5       2    600        4                   290             500

以上是关于将组平均值分配给python / pandas中的每一行的主要内容,如果未能解决你的问题,请参考以下文章

将字符串值分配给pandas中的单元格

如果 NaN 用另一列替换,Pandas 将组中的最后一项替换

如何将 python 对象(如字典)分配给 pandas 列

在 Pandas 数据框中查找每三列的平均值

将组 ID 返回到 pandas 数据帧

Python Pandas:将 DataFrame 组的最后一个值分配给该组的所有条目