计算熊猫列中的重复次数[重复]

Posted

技术标签:

【中文标题】计算熊猫列中的重复次数[重复]【英文标题】:Count the repetition in a column in pandas [duplicate] 【发布时间】:2017-05-10 07:17:16 【问题描述】:

我有一列有一个节目的票号,(每个家庭成员使用相同的票号)我想通过计算票号重复的次数来创建一个家庭规模的新列。

ticketID
113796
2543
19950
382653
349211
3101297
PC 17562
113503
113503

【问题讨论】:

在 Stack Overflow 上,您需要展示您所做的尝试。请阅读***.com/help/how-to-ask 获取一些提示。我们不会只为您编写代码 df.ticketID.values_counts() 【参考方案1】:

你可以使用transform

In [152]: df
Out[152]:
   ticketID
0         1
1         2
2         1
3         1
4         2

In [153]: df['family_size'] = df.groupby('ticketID')['ticketID'].transform('size')

In [154]: df
Out[154]:
   ticketID  family_size
0         1            3
1         2            2
2         1            3
3         1            3
4         2            2

【讨论】:

【参考方案2】:

试试这个:

In [123]: df = pd.DataFrame('ticketID':np.random.randint(0, 3, 5))

In [124]: df
Out[124]:
   ticketID
0         1
1         2
2         1
3         1
4         2

In [125]: df['family_size'] = df.ticketID.map(df.ticketID.value_counts())

In [126]: df
Out[126]:
   ticketID  family_size
0         1            3
1         2            2
2         1            3
3         1            3
4         2            2

【讨论】:

以上是关于计算熊猫列中的重复次数[重复]的主要内容,如果未能解决你的问题,请参考以下文章

熊猫计算列中每个值的出现次数

使用熊猫替换列中的值时出错[重复]

熊猫:将列中的列表拆分为多行[重复]

熊猫根据索引标签选择特定列中的值[重复]

组合替换熊猫列中的字符串[重复]

从熊猫列中的列表创建多列[重复]