Python pandas:在我的数据框中添加一个计算变量的列

Posted

技术标签:

【中文标题】Python pandas:在我的数据框中添加一个计算变量的列【英文标题】:Python pandas: Add a column to my dataframe that counts a variable 【发布时间】:2015-06-29 18:28:31 【问题描述】:

我有一个这样的数据框“gt”:

org     group
org1      1
org2      1
org3      2
org4      3
org5      3
org6      3

我想将列“count”添加到 gt 数据框以计算组的成员数,预期结果如下:

org     group   count
org1      1       2
org2      1       2
org3      2       1
org4      3       3
org5      3       3
org6      3       3

我知道如何对组中的一项进行计数,但不知道如何使所有组项的计数重复,这是我使用的代码:

gtcounts = gt.groupby('group').count()

有人可以帮忙吗?

【问题讨论】:

【参考方案1】:

调用 transform 这将返回一个与原始 df 对齐的 Series:

In [223]:

df['count'] = df.groupby('group')['group'].transform('count')
df
Out[223]:
    org  group  count
0  org1      1      2
1  org2      1      2
2  org3      2      1
3  org4      3      3
4  org5      3      3
5  org6      3      3

【讨论】:

以上是关于Python pandas:在我的数据框中添加一个计算变量的列的主要内容,如果未能解决你的问题,请参考以下文章

Pandas 根据另一个数据框中的匹配列填充新的数据框列

如何从 imdb 获取更多信息并将其保存在 pandas 数据框中? [复制]

限制 Pandas 数据框中显示的最大列数 [重复]

在 python pandas 数据框中添加时间序列强度的廉价方法

如果 ID 存在于其他数据框中,则 Python Pandas 数据框在新列中添加“1”

Python - Pandas - 导入 Excel 文件,遍历每一行,添加新值,并添加到数据框