如何截断日期时间对象的时间?

Posted

技术标签:

【中文标题】如何截断日期时间对象的时间?【英文标题】:How to truncate the time on a datetime object? 【发布时间】:2011-07-25 11:12:19 【问题描述】:

截断 python datetime 对象的经典方法是什么?

在这种特殊情况下,直到今天。所以基本上将小时、分钟、秒和微秒设置为 0。

我希望输出也是 datetime 对象,而不是字符串。

【问题讨论】:

【参考方案1】:

我想这就是你要找的……

>>> import datetime
>>> dt = datetime.datetime.now()
>>> dt = dt.replace(hour=0, minute=0, second=0, microsecond=0) # Returns a copy
>>> dt
datetime.datetime(2011, 3, 29, 0, 0)

但如果你真的不关心事物的时间方面,那么你真的应该只传递date对象......

>>> d_truncated = datetime.date(dt.year, dt.month, dt.day)
>>> d_truncated
datetime.date(2011, 3, 29)

【讨论】:

使用时区感知 dt,datetime.datetime(dt.year, dt.month, dt.day) 会丢弃 tzinfo 信息。 如果你只是在找今天,你也可以做 datetime.date.today() 请注意,python 2 和 python 3 docs 都声明 replace() 方法返回一个日期时间对象,因此正确的咒语是:dt = datetime.datetime.now().replace(hour=0, minute=0, second=0, microsecond=0)跨度> OP 想要datetime,而不是date 对象(您可以使用dt.date() 调用获得(无需使用显式构造函数))。如果datetime adds nanosecond support,.replace() 方法可能会失败。你可以use datetime.combine() instead。 @chrisw 为什么不把它写在一行datetime.datetime.now().replace(hour=0, minute=0, second=0, microsecond=0)【参考方案2】:

如果您不关心时间,请使用date 而不是datetime

>>> now = datetime.now()
>>> now.date()
datetime.date(2011, 3, 29)

您可以像这样更新日期时间:

>>> now.replace(minute=0, hour=0, second=0, microsecond=0)
datetime.datetime(2011, 3, 29, 0, 0)

【讨论】:

使用时区感知的日期时间,now.date() 会丢弃 tzinfo 信息。 @ʇsәɹoɈ: 你可以这样做get the timezone-aware midnight 请注意,to convert it back to datetime 有点痛苦。【参考方案3】:

四年后:另一种方式,避免replace

我知道四年前公认的答案有效,但这似乎比使用 replace 轻一点:

dt = datetime.date.today()
dt = datetime.datetime(dt.year, dt.month, dt.day)

备注

当您创建 datetime 对象而不将时间属性传递给构造函数时,您将获得午夜。 正如其他人所指出的,这假设您需要一个日期时间对象以供以后与 timedelta 一起使用。 当然,您可以将其替换为第一行:dt = datetime.datetime.now()

【讨论】:

使用时区感知的日期时间,tzinfo 信息不会在两者之间共享。【参考方案4】:

您不能截断日期时间对象,因为it is immutable。

但是,这里有一种方法可以构造一个包含 0 小时、分钟、秒和微秒字段的新日期时间,而不会丢弃原始日期或 tzinfo:

newdatetime = now.replace(hour=0, minute=0, second=0, microsecond=0)

【讨论】:

+1: 如果你把replace 选项放在第一位,因为这可能是他们想要的。 使用tzinfo=now.tzinfo是不正确的。午夜的tzinfo 可能不同,例如,澳大利亚/墨尔本时区2012-04-01 00:09:00(上午9 点)的UTC 偏移量是AEST+10:00,但2012-04-01 00:00:00(午夜)是AEDT+11:00——有结束-当天的夏令时过渡。您可以使用pytz 模块来修复它,请参阅我的答案。【参考方案5】:

要获得与给定日期时间对象对应的午夜,您可以使用datetime.combine() method:

>>> from datetime import datetime, time
>>> dt = datetime.utcnow()
>>> dt.date()
datetime.date(2015, 2, 3)
>>> datetime.combine(dt, time.min)
datetime.datetime(2015, 2, 3, 0, 0)

与the .replace() method 相比的优势在于,即使datetime module introduces the nanoseconds support,基于datetime.combine() 的解决方案也将继续工作。

tzinfo 可以在必要时保留,但 utc 偏移量在午夜可能不同,例如,由于 DST 转换,因此一个简单的解决方案(设置 tzinfo 时间属性)可能会失败。见How do I get the UTC time of “midnight” for a given timezone?

【讨论】:

它可以为你节省大量的打字时间(与 replace() 相比)。【参考方案6】:

您可以为此使用pandas(尽管它可能是该任务的开销)。您可以使用round、floor 和ceil 来表示通常的数字以及来自offset-aliases 的任何pandas 频率:

import pandas as pd
import datetime as dt

now = dt.datetime.now()
pd_now = pd.Timestamp(now)

freq = '1d'
pd_round = pd_now.round(freq)
dt_round = pd_round.to_pydatetime()

print(now)
print(dt_round)

"""
2018-06-15 09:33:44.102292
2018-06-15 00:00:00
"""

【讨论】:

【参考方案7】:

在https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.dt.floor.html查看更多信息

现在是 2019 年,我认为最有效的方法是:

df['truncate_date'] = df['timestamp'].dt.floor('d')

【讨论】:

是的,让我们使用 dt.floor!!【参考方案8】:

您可以使用 datetime.strftime 来提取日、月、年...

例子:

from datetime import datetime
d = datetime.today()

# Retrieves the day and the year
print d.strftime("%d-%Y")

输出(今天):

29-2011

如果您只想检索日期,可以使用 day 属性,例如:

from datetime import datetime
d = datetime.today()

# Retrieves the day
print d.day

输出(今天):

29

【讨论】:

好吧,事情是我已经这样做了一次,所以这可能比在 datetime 对象中设置小时分钟等字段有更多的开销。 嘿,这是一种奇怪的做法,你实际上可以这样做d.day等。【参考方案9】:

有一个很棒的库用于处理日期:Delorean

import datetime
from delorean import Delorean
now = datetime.datetime.now()
d = Delorean(now, timezone='US/Pacific')

>>> now    
datetime.datetime(2015, 3, 26, 19, 46, 40, 525703)

>>> d.truncate('second')
Delorean(datetime=2015-03-26 19:46:40-07:00, timezone='US/Pacific')

>>> d.truncate('minute')
Delorean(datetime=2015-03-26 19:46:00-07:00, timezone='US/Pacific')

>>> d.truncate('hour')
Delorean(datetime=2015-03-26 19:00:00-07:00, timezone='US/Pacific')

>>> d.truncate('day')
Delorean(datetime=2015-03-26 00:00:00-07:00, timezone='US/Pacific')

>>> d.truncate('month')
Delorean(datetime=2015-03-01 00:00:00-07:00, timezone='US/Pacific')

>>> d.truncate('year')
Delorean(datetime=2015-01-01 00:00:00-07:00, timezone='US/Pacific')

如果你想取回日期时间值:

>>> d.truncate('year').datetime
datetime.datetime(2015, 1, 1, 0, 0, tzinfo=<DstTzInfo 'US/Pacific' PDT-1 day, 17:00:00 DST>)

【讨论】:

如果结果时间具有不同的 utc 偏移量,例如由于 DST 转换,它会返回错误的时间(错误的 utc 偏移量)。见How do I get the UTC time of “midnight” for a given timezone?【参考方案10】:

如果您正在处理 DateTime 类型的 Series,则有一种更有效的方法来截断它们,特别是当 Series 对象有很多行时。

你可以使用floor函数

例如,如果您想将其截断为小时:

生成日期范围

times = pd.Series(pd.date_range(start='1/1/2018 04:00:00', end='1/1/2018 22:00:00', freq='s'))

我们可以比较一下replace和floor函数的运行时间。

%timeit times.apply(lambda x : x.replace(minute=0, second=0, microsecond=0))
>>> 341 ms ± 18.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

%timeit times.dt.floor('h')
>>>>2.26 ms ± 451 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

【讨论】:

这个答案是最好的,但只有 1 票赞成,所以我赞成你的答案:)【参考方案11】:

有一个模块 datetime_truncate 可以为你处理这个。它只是调用 datetime.replace。

【讨论】:

【参考方案12】:

6 年后...我发现了这篇文章,我更喜欢 numpy 方法:

import numpy as np
dates_array = np.array(['2013-01-01', '2013-01-15', '2013-01-30']).astype('datetime64[ns]')
truncated_dates = dates_array.astype('datetime64[D]')

干杯

【讨论】:

【参考方案13】:
>>> import datetime
>>> dt = datetime.datetime.now()
>>> datetime.datetime.date(dt)
datetime.date(2019, 4, 2)

【讨论】:

【参考方案14】:

这是另一种适合一行但不是特别优雅的方式:

dt = datetime.datetime.fromordinal(datetime.date.today().toordinal())

【讨论】:

【参考方案15】:

你可以使用

datetime.date.today()

它很轻,返回的正是你想要的。

【讨论】:

之前已经给出了同样的答案,没什么新意了。 对不起@slfan 但我没有看到任何带有你名字的帖子,即使使用浏览器中的“搜索”也是如此。 不是我,是 3 年前的 zx81。搜索 datetime.date.today()。如果一个答案是正确的,你应该投票,而不是再次回答。 转换为日期时间【参考方案16】:

截断是什么意思?

您可以通过使用 strftime() 方法和使用适当的格式字符串来完全控制格式。

http://docs.python.org/library/datetime.html#strftime-strptime-behavior

【讨论】:

以上是关于如何截断日期时间对象的时间?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Oracle 中将日期截断为秒

数据截断:不正确的日期时间值:''

将日期截断为仅小时/分钟

Pandas groupby 聚合以截断最早日期而不是最旧日期

使用 Now() 函数时截断日期[重复]

截断日期时间超过 n 天的表