在python中的数据框中计算与引用可变值的条件相匹配的行

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在python中的数据框中计算与引用可变值的条件相匹配的行相关的知识,希望对你有一定的参考价值。

我正在尝试在数据框BoughtProducts中创建一列CustomerPurchases,其中将包含该客户先前的购买次数。数据框包含订单日期(OrderDateTime)和客户编号(CustomerNumber)等,我想为每一行计数,数据框中有多少行具有相同客户编号和较早订购日期的行。我试图那样做:

for index, row in BoughtProducts.iterrows():

  row['CustomersPurchases']=BoughtProducts[(BoughtProducts['OrderDateTime']<=row['OrderDateTime'])&(BoughtProducts['CustomerNumber']==row['CustomerNumber'])].count()

但是运行循环需要花很多时间,我相信有一种更简便,更快速的方法。

答案

可以使用sort_valuesgroupbycumcount功能来完成。

BoughtProducts['CustomersPurchases'] = (
    BoughtProducts
    .sort_values(by['OrderDateTime']))
    .groupby('CustomerNumber')
    .cumcount()+1
)

以上是关于在python中的数据框中计算与引用可变值的条件相匹配的行的主要内容,如果未能解决你的问题,请参考以下文章

python可变数据和不可变数据

数据框中现有值的 Python 条件 NaN 值替换

python中的可变数据类型和不可变数据类型

Pandas:如何根据特定列上特定值的条件选择数据框中的行[重复]

Python:计算需要从数据框中分组的值的 5 年滚动 CAGR

熊猫数据框中的多个if条件 - Python