在python中的数据框中计算与引用可变值的条件相匹配的行

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在python中的数据框中计算与引用可变值的条件相匹配的行相关的知识,希望对你有一定的参考价值。

我正在尝试在数据框BoughtProducts中创建一列CustomerPurchases,其中将包含该客户先前的购买次数。数据框包含订单日期(OrderDateTime)和客户编号(CustomerNumber)等,我想为每一行计数,数据框中有多少行具有相同客户编号和较早订购日期的行。我试图那样做:

for index, row in BoughtProducts.iterrows():

  row['CustomersPurchases']=BoughtProducts[(BoughtProducts['OrderDateTime']<=row['OrderDateTime'])&(BoughtProducts['CustomerNumber']==row['CustomerNumber'])].count()

但是运行循环需要花很多时间,我相信有一种更简便,更快速的方法。

答案

可以使用sort_valuesgroupbycumcount功能来完成。

BoughtProducts['CustomersPurchases'] = (
    BoughtProducts
    .sort_values(by['OrderDateTime']))
    .groupby('CustomerNumber')
    .cumcount()+1
)

以上是关于在python中的数据框中计算与引用可变值的条件相匹配的行的主要内容,如果未能解决你的问题,请参考以下文章

Pandas:如何根据特定列上特定值的条件选择数据框中的行[重复]

可变数据类型与不可变数据类型

R计算数据框中的百分比值

如何计算包含一组列中的值和 Pandas 数据框中另一列中的另一个值的行数?

python可变数据和不可变数据

“不能返回引用临时值的值”和 Rust 中的内部可变性