如何将日期时间列四舍五入到最近的一刻钟

Posted

技术标签:

【中文标题】如何将日期时间列四舍五入到最近的一刻钟【英文标题】:How do I round datetime column to nearest quarter hour 【发布时间】:2015-11-27 10:52:06 【问题描述】:

我已将数据文件加载到 Python pandas 数据框中。我有一个格式为2015-07-18 13:53:33.280 的日期时间列。

我需要做的是创建一个新列,将其四舍五入到最接近的一刻钟。因此,上面的日期将四舍五入为2015-07-18 13:45:00.000

如何在熊猫中做到这一点?我尝试使用来自here 的解决方案,但收到'Series' object has no attribute 'year' 错误。

【问题讨论】:

【参考方案1】:

您可以使用round(freq)。还有一个快捷方式column.dt 用于访问日期时间函数(正如@laurens-koppenol 所建议的那样)。

这里是单行:

df['old column'].dt.round('15min')  

可以在here 中找到有效频率的字符串别名。完整的工作示例:

In [1]: import pandas as pd    
In [2]: df = pd.DataFrame([pd.Timestamp('2015-07-18 13:53:33.280'),
                           pd.Timestamp('2015-07-18 13:33:33.330')],
                         columns=['old column'])

In [3]: df['new column']=df['old column'].dt.round('15min')  
In [4]: df
Out[4]: 
               old column          new column
0 2015-07-18 13:53:33.280 2015-07-18 14:00:00
1 2015-07-18 13:33:33.330 2015-07-18 13:30:00

【讨论】:

如果想要四舍五入到最接近的时间低于或高于,可以分别使用floorceil。见code【参考方案2】:

假设您的系列由 datetime 对象组成,您需要使用 Series.apply 。示例 -

import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*(dt.minute // 15)))

上面的例子总是四舍五入到前一刻钟(行为类似于 floor 函数)。

编辑

四舍五入到正确的一刻钟(如 ,如果它比上一个季度晚 7 分 30 秒,则显示下一个季度)。我们可以使用下面的例子 -

import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*round((float(dt.minute) + float(dt.second)/60) / 15)))

上面只考虑最近的秒数,如果你想考虑毫秒/微秒,你可以将它添加到上面的等式中 - (float(dt.minute) + float(dt.second)/60 + float(dt.microsecond)/60000000)

【讨论】:

我相信这个答案实际上是不正确的 - 因为它总是会向下舍入到它之前的一刻钟,而不是最接近的一刻钟。 @ThomasMo 也更新了答案。以前的行为类似于floor 行为 我们能否将它传递给一个函数,例如 def secondBackAdjuster(numSec): if numSec > 30: numSec = 30 else: numSec = 0 numSec , # Applog['TimeCreatedAdj'] = secondBackAdjuster(Applog ['TimeCreatedAdj']) 答案仍然不正确。当时间为 7:59 时,这将尝试执行 datetime(y,m,d,7,60),并失败,因为 60 是 minute 的无效值。 @tworec 有一个更好的答案,应该被接受。【参考方案3】:

这看起来更好一点

column.dt. 允许对日期时间列使用日期时间函数,就像 column.str. 对类似字符串的列所做的那样

datetime-like properties API reference

import pandas as pd

# test df
df = pd.DataFrame(['old_column':pd.Timestamp('2015-07-18 13:53:33.280')])

df['new_column'] = df['old_column'].dt.round('15min')

df

【讨论】:

【参考方案4】:

Anand S Kumar 的答案不会四舍五入到最接近的一刻钟,而是将分钟截断到最接近的 15 分钟。

实际上,在您的示例中,2015-07-18 13:53:33.280 应该四舍五入到 2015-07-18 14:00:00.000,因为 53:33.280 比 45 分钟更接近 60 分钟。

我在this post 中找到了更可靠的四舍五入答案。

对于您的情况,这应该有效:

import datetime

def round_time(time, round_to):
    """roundTo is the number of minutes to round to"""
    rounded = time + datetime.timedelta(minutes=round_to/2.)
    rounded -= datetime.timedelta(minutes=rounded.minute % round_to,
                                  seconds=rounded.second,
                                  microseconds=rounded.microsecond)
    return rounded

dt['dtcolumn'] = df['dtcolumn'].apply(lambda x: round_time(x))

【讨论】:

以上是关于如何将日期时间列四舍五入到最近的一刻钟的主要内容,如果未能解决你的问题,请参考以下文章

SQL函数将日期四舍五入到最近的月份

如何将 Informix 日期时间按半小时、四分之一和小时四舍五入?

将日期列和时间列合并到日期时间

将日期列取消透视到 Oracle 中复杂查询的单个列

如何在 C# 中使用 csvHelper 将两个单独列中的日期和时间合并到一个新的日期时间列中

如何将年、月和日列合并到单个日期时间列?