groupby+agg

Posted ustc-zcc

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了groupby+agg相关的知识,希望对你有一定的参考价值。

在处理pandas表格数据时,有时会遇到这样的问题:按照某一列聚合后,判断另一列是否出现唯一值,比如安泰杯--跨境电商比赛中,某个商人的ID如果出现在两个国家(xx和yy),则要剔除这样的数据,这就需要我们按照商人ID进行groupby,然后判断国家这一列是否值唯一,不唯一则剔除。

def unique_num(x):

  return len(np.unique(x))  #自定义函数

train.groupby([‘buyer_id‘]).agg(‘country_id‘:unique_num)

 

下面对groupby和agg使用方法进行总结:

以上是关于groupby+agg的主要内容,如果未能解决你的问题,请参考以下文章

将 GroupBy 对象 (groupby().size) 转换为字典

为啥'groupby(x,np.isnan)'的行为与'groupby(x)如果键是nan'不同?

spoon中的分组groupby在哪里

python [groupby]示例groupby #pandas #secret

为啥将 groupby 转换为列表时 groupby 分组会发生变化? [复制]

hive Groupby 输出未包含在groupby的字段