计算熊猫列中的重复次数[重复]
Posted
技术标签:
【中文标题】计算熊猫列中的重复次数[重复]【英文标题】:Count the repetition in a column in pandas [duplicate] 【发布时间】:2017-05-10 07:17:16 【问题描述】:我有一列有一个节目的票号,(每个家庭成员使用相同的票号)我想通过计算票号重复的次数来创建一个家庭规模的新列。
ticketID
113796
2543
19950
382653
349211
3101297
PC 17562
113503
113503
【问题讨论】:
在 Stack Overflow 上,您需要展示您所做的尝试。请阅读***.com/help/how-to-ask 获取一些提示。我们不会只为您编写代码df.ticketID.values_counts()
【参考方案1】:
你可以使用transform
In [152]: df
Out[152]:
ticketID
0 1
1 2
2 1
3 1
4 2
In [153]: df['family_size'] = df.groupby('ticketID')['ticketID'].transform('size')
In [154]: df
Out[154]:
ticketID family_size
0 1 3
1 2 2
2 1 3
3 1 3
4 2 2
【讨论】:
【参考方案2】:试试这个:
In [123]: df = pd.DataFrame('ticketID':np.random.randint(0, 3, 5))
In [124]: df
Out[124]:
ticketID
0 1
1 2
2 1
3 1
4 2
In [125]: df['family_size'] = df.ticketID.map(df.ticketID.value_counts())
In [126]: df
Out[126]:
ticketID family_size
0 1 3
1 2 2
2 1 3
3 1 3
4 2 2
【讨论】:
以上是关于计算熊猫列中的重复次数[重复]的主要内容,如果未能解决你的问题,请参考以下文章