Pandas 按值 1 对列进行分组并按频率排序
Posted
技术标签:
【中文标题】Pandas 按值 1 对列进行分组并按频率排序【英文标题】:Pandas Group Columns by Value of 1 and Sort By Frequency 【发布时间】:2022-01-03 03:18:36 【问题描述】:我必须使用这个数据框:
d = 'Apple': [0,0,1,0,1,0], 'Aurora': [0,0,0,0,0,1], 'Barn': [0,1,1,0,0,0]
df = pd.DataFrame(data=d)
Apple Aurora Barn
0 0 0 0
1 0 0 1
2 1 0 1
3 0 0 0
4 1 0 0
5 0 1 0
并计算每一列中第一个的频率,并创建一个新的数据框,如下所示:
df = pd.DataFrame([['Apple',0.3333], ['Aurora',0.166666], ['Barn', 0.3333]], columns = ['index', 'value'])
index value
0 Apple 0.333300
1 Aurora 0.166666
2 Barn 0.333300
我试过这个:
df['freq'] = df.groupby(1)[1].transform('count')
但我得到一个错误:KeyError: 1
所以我不确定如何跨行和列计算值 1,并按列名和每列中 1 的频率进行分组。
【问题讨论】:
试试这个:df.mean()
【参考方案1】:
如果我理解正确,您可以这样做:
freq = df.mean()
输出:
>>> freq
Apple 0.333333
Aurora 0.166667
Barn 0.333333
dtype: float64
【讨论】:
哇,这很简单。它有效! 是的,很简单。我知道那种感觉:) 哈哈,太真实了!以上是关于Pandas 按值 1 对列进行分组并按频率排序的主要内容,如果未能解决你的问题,请参考以下文章
将javascript数组中的重复值分组在一起,然后按值名称升序对这些组进行排序
pandas 如何使用 groupby 在标签中按日期对列进行分组?