groupby - python 熊猫数据框

Posted

技术标签:

【中文标题】groupby - python 熊猫数据框【英文标题】:groupby - python pandas dataframe 【发布时间】:2016-10-09 15:32:21 【问题描述】:

我有一个包含 date,name,id 列的数据框(数据是多余的)。 现在我想获得组合的频率(date,name,id) 为此,我在我的数据框上应用groupby

df.groupby(['date','uname','id']).size()

这给了我这样的结果:

date        uname                id       size                         
2016-02-11  a@abc.com            111       1
            b@abc.com            1080      2
            ar@ata.com           5315      1
                                 5317      1
            aru628@gmail.com     536       2
2-16-02-12  ch45@gmail.com       588       1
                                 593       2    
            doy5@gmail.com       322       1

但我希望我的结果是这样的:

date        uname                id       size                         
2016-02-11  a@abc.com            111       1
2016-02-11  b@abc.com            1080      2
2016-02-11  ar@ata.com           5315      1
2016-02-11  ar@ata.com           5317      1
2016-02-11  aru628@gmail.com     536       2
2-16-02-12  ch45@gmail.com       588       1
2-16-02-12  ch45@gmail.com       593       2    
2-16-02-12  doy5@gmail.com       322       1

欣赏建议

【问题讨论】:

【参考方案1】:

你需要reset_index:

df.groupby(['date','uname','id']).size().reset_index()

         date             uname    id  size
0  2016-02-11         a@abc.com   111     1
1  2016-02-11         b@abc.com  1080     2
2  2016-02-11        ar@ata.com  5315     1
3  2016-02-11        ar@ata.com  5317     1
4  2016-02-11  aru628@gmail.com   536     2
5  2-16-02-12    ch45@gmail.com   588     1
6  2-16-02-12    ch45@gmail.com   593     2
7  2-16-02-12    doy5@gmail.com   322     1

【讨论】:

太酷了!我一直在检查reset_index,但我尝试了一些误解。谢谢!! 很高兴能帮到您!美好的一天!

以上是关于groupby - python 熊猫数据框的主要内容,如果未能解决你的问题,请参考以下文章

如何在python的这个熊猫数据框中使用groupby或pivot [重复]

熊猫数据框:groupby 和 plot 有两个不同的列

Seaborn通过多个groupby绘制熊猫数据框

groupby之后的熊猫数据框列[重复]

如何调试熊猫 groupby 应用功能

带有groupby的熊猫数据框滚动窗口