Python pandas:在我的数据框中添加一个计算变量的列
Posted
技术标签:
【中文标题】Python pandas:在我的数据框中添加一个计算变量的列【英文标题】:Python pandas: Add a column to my dataframe that counts a variable 【发布时间】:2015-06-29 18:28:31 【问题描述】:我有一个这样的数据框“gt”:
org group
org1 1
org2 1
org3 2
org4 3
org5 3
org6 3
我想将列“count”添加到 gt 数据框以计算组的成员数,预期结果如下:
org group count
org1 1 2
org2 1 2
org3 2 1
org4 3 3
org5 3 3
org6 3 3
我知道如何对组中的一项进行计数,但不知道如何使所有组项的计数重复,这是我使用的代码:
gtcounts = gt.groupby('group').count()
有人可以帮忙吗?
【问题讨论】:
【参考方案1】:调用 transform
这将返回一个与原始 df 对齐的 Series:
In [223]:
df['count'] = df.groupby('group')['group'].transform('count')
df
Out[223]:
org group count
0 org1 1 2
1 org2 1 2
2 org3 2 1
3 org4 3 3
4 org5 3 3
5 org6 3 3
【讨论】:
以上是关于Python pandas:在我的数据框中添加一个计算变量的列的主要内容,如果未能解决你的问题,请参考以下文章
如何从 imdb 获取更多信息并将其保存在 pandas 数据框中? [复制]
在 python pandas 数据框中添加时间序列强度的廉价方法