在pandas中使用groupby和聚合的最佳方法

Question

我有一个名为客户端的表，我想显示有人根据用户ID注册或购买了多少次。

目标是有一个表格，显示registration_complete的总和，并根据用户ID购买

这是我写的代码。不幸的是并非所有列都显示出来

  new_file= new_data.groupby(['userid']) 
  ['Registration_Complete','Purchase'].agg('sum')
  new_file.head(5)

这是我用来确定注册并基于用户ID购买的表

 Event_day  timestamp        install  userid  registration   purchase
 1/1/1900   1/1/1900 16:10    yes     555221     1               0
 1/1/1900   1/1/1900 16:12    yes     555221     1               1
 2/19/2010  1/19/2010 16:40   no      533211     0               1
 2/19/2010  1/19/2016 16:53   yes     533211     0               1
 2/20/2017  2/20/2017 15:46   yes     53200      1               0
 3/15/2017  3/15/2018 15:48   yes     53200      1               0
 3/15/2017  3/15/2018 20:14   yes     53200      1               0

我想要一些可以给我总和的东西

Event_day  timestamp        install  userid  registration   purchase
1/1/1900   1/1/1900 16:10    yes     555221     2               0
2/19/2010  1/19/2016 16:53   yes     533211     0               2
3/15/2017  3/15/2018 20:14   yes     53200      5               0

Answer 1

另一答案

Answer 2

另一答案

在pandas中使用groupby和聚合的最佳方法

编辑：