在python中的数据框中计算与引用可变值的条件相匹配的行
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在python中的数据框中计算与引用可变值的条件相匹配的行相关的知识,希望对你有一定的参考价值。
我正在尝试在数据框BoughtProducts
中创建一列CustomerPurchases
,其中将包含该客户先前的购买次数。数据框包含订单日期(OrderDateTime
)和客户编号(CustomerNumber
)等,我想为每一行计数,数据框中有多少行具有相同客户编号和较早订购日期的行。我试图那样做:
for index, row in BoughtProducts.iterrows():
row['CustomersPurchases']=BoughtProducts[(BoughtProducts['OrderDateTime']<=row['OrderDateTime'])&(BoughtProducts['CustomerNumber']==row['CustomerNumber'])].count()
但是运行循环需要花很多时间,我相信有一种更简便,更快速的方法。
答案
可以使用sort_values
,groupby
和cumcount
功能来完成。
BoughtProducts['CustomersPurchases'] = (
BoughtProducts
.sort_values(by['OrderDateTime']))
.groupby('CustomerNumber')
.cumcount()+1
)
以上是关于在python中的数据框中计算与引用可变值的条件相匹配的行的主要内容,如果未能解决你的问题,请参考以下文章
Pandas:如何根据特定列上特定值的条件选择数据框中的行[重复]