在Python中计算数据框中最后一行和所有其他行之间的时间差

Posted

技术标签:

【中文标题】在Python中计算数据框中最后一行和所有其他行之间的时间差【英文标题】:Calculate time difference between last row and all other rows in a dataframe in Python 【发布时间】:2021-07-17 01:33:12 【问题描述】:

我有一堆看起来像这样的数据框

   DATE        A     B    
2021-01-01     1     2   
2021-01-05     1     2
2021-01-06     1     2
2021-01-10     1     2
2021-01-20     1     2

我想计算所有行与最后一行之间的时间差。这意味着我想创建另一列,其中包含该行与数据框中最后一行之间的时间差。所以它应该是这样的:

   DATE        A     B     timediff  
2021-01-01     1     2     19 days
2021-01-05     1     2     14 days
2021-01-06     1     2     13 days
2021-01-10     1     2     9 days
2021-01-20     1     2     0 days

有没有办法做到这一点? Date 已经是一个日期时间变量。

谢谢

【问题讨论】:

【参考方案1】:

你可以减去最后一行并取绝对值:

df['timediff_days'] =df['DATE'].sub(df['DATE'].iloc[-1]).dt.days.abs()

或者:

df['timediff'] = pd.Timedelta(0,unit='d')-df['DATE'].sub(df['DATE'].iloc[-1])

        DATE  A  B timediff
0 2021-01-01  1  2  19 days
1 2021-01-05  1  2  15 days
2 2021-01-06  1  2  14 days
3 2021-01-10  1  2  10 days
4 2021-01-20  1  2   0 days

【讨论】:

以上是关于在Python中计算数据框中最后一行和所有其他行之间的时间差的主要内容,如果未能解决你的问题,请参考以下文章

在Javascript中计算数据集中每个状态的值

在mysql中计算数据并按周分组

如何让 DOM 呈现对 VUE.js 项目中计算数据的更改

在 Django 模板中计算数据库中的 True 或 False(1 或 0)值

在 OpenGL 中计算法线矩阵

如何在时间序列数据框中索引出每一天的第一行和最后一行?