如何将日期时间列四舍五入到最近的一刻钟
Posted
技术标签:
【中文标题】如何将日期时间列四舍五入到最近的一刻钟【英文标题】:How do I round datetime column to nearest quarter hour 【发布时间】:2015-11-27 10:52:06 【问题描述】:我已将数据文件加载到 Python pandas 数据框中。我有一个格式为2015-07-18 13:53:33.280
的日期时间列。
我需要做的是创建一个新列,将其四舍五入到最接近的一刻钟。因此,上面的日期将四舍五入为2015-07-18 13:45:00.000
。
如何在熊猫中做到这一点?我尝试使用来自here 的解决方案,但收到'Series' object has no attribute 'year'
错误。
【问题讨论】:
【参考方案1】:您可以使用round(freq)
。还有一个快捷方式column.dt
用于访问日期时间函数(正如@laurens-koppenol 所建议的那样)。
这里是单行:
df['old column'].dt.round('15min')
可以在here 中找到有效频率的字符串别名。完整的工作示例:
In [1]: import pandas as pd
In [2]: df = pd.DataFrame([pd.Timestamp('2015-07-18 13:53:33.280'),
pd.Timestamp('2015-07-18 13:33:33.330')],
columns=['old column'])
In [3]: df['new column']=df['old column'].dt.round('15min')
In [4]: df
Out[4]:
old column new column
0 2015-07-18 13:53:33.280 2015-07-18 14:00:00
1 2015-07-18 13:33:33.330 2015-07-18 13:30:00
【讨论】:
如果想要四舍五入到最接近的时间低于或高于,可以分别使用floor
和ceil
。见code【参考方案2】:
假设您的系列由 datetime
对象组成,您需要使用 Series.apply
。示例 -
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*(dt.minute // 15)))
上面的例子总是四舍五入到前一刻钟(行为类似于 floor 函数)。
编辑
四舍五入到正确的一刻钟(如 ,如果它比上一个季度晚 7 分 30 秒,则显示下一个季度)。我们可以使用下面的例子 -
import datetime
df['<column>'] = df['<column>'].apply(lambda dt: datetime.datetime(dt.year, dt.month, dt.day, dt.hour,15*round((float(dt.minute) + float(dt.second)/60) / 15)))
上面只考虑最近的秒数,如果你想考虑毫秒/微秒,你可以将它添加到上面的等式中 - (float(dt.minute) + float(dt.second)/60 + float(dt.microsecond)/60000000)
【讨论】:
我相信这个答案实际上是不正确的 - 因为它总是会向下舍入到它之前的一刻钟,而不是最接近的一刻钟。 @ThomasMo 也更新了答案。以前的行为类似于floor
行为
我们能否将它传递给一个函数,例如 def secondBackAdjuster(numSec): if numSec > 30: numSec = 30 else: numSec = 0 numSec , # Applog['TimeCreatedAdj'] = secondBackAdjuster(Applog ['TimeCreatedAdj'])
答案仍然不正确。当时间为 7:59 时,这将尝试执行 datetime(y,m,d,7,60)
,并失败,因为 60 是 minute
的无效值。 @tworec 有一个更好的答案,应该被接受。【参考方案3】:
这看起来更好一点
column.dt.
允许对日期时间列使用日期时间函数,就像 column.str.
对类似字符串的列所做的那样
datetime-like properties API reference
import pandas as pd
# test df
df = pd.DataFrame(['old_column':pd.Timestamp('2015-07-18 13:53:33.280')])
df['new_column'] = df['old_column'].dt.round('15min')
df
【讨论】:
【参考方案4】:Anand S Kumar 的答案不会四舍五入到最接近的一刻钟,而是将分钟截断到最接近的 15 分钟。
实际上,在您的示例中,2015-07-18 13:53:33.280
应该四舍五入到 2015-07-18 14:00:00.000
,因为 53:33.280
比 45 分钟更接近 60 分钟。
我在this post 中找到了更可靠的四舍五入答案。
对于您的情况,这应该有效:
import datetime
def round_time(time, round_to):
"""roundTo is the number of minutes to round to"""
rounded = time + datetime.timedelta(minutes=round_to/2.)
rounded -= datetime.timedelta(minutes=rounded.minute % round_to,
seconds=rounded.second,
microseconds=rounded.microsecond)
return rounded
dt['dtcolumn'] = df['dtcolumn'].apply(lambda x: round_time(x))
【讨论】:
以上是关于如何将日期时间列四舍五入到最近的一刻钟的主要内容,如果未能解决你的问题,请参考以下文章
如何将 Informix 日期时间按半小时、四分之一和小时四舍五入?