使用 strptime 将带偏移量的时间戳转换为 datetime obj

Posted

技术标签:

【中文标题】使用 strptime 将带偏移量的时间戳转换为 datetime obj【英文标题】:Convert timestamps with offset to datetime obj using strptime 【发布时间】:2012-08-30 04:54:40 【问题描述】:

我正在尝试转换格式为“2012-07-24T23:14:29-07:00”的时间戳 使用 strptime 方法到 python 中的日期时间对象。问题在于最后的时间偏移(-07:00)。没有偏移我可以成功地做

time_str = "2012-07-24T23:14:29"

time_obj=datetime.datetime.strptime(time_str,'%Y-%m-%dT%H:%M:%S')

但是我尝试了偏移量

time_str = "2012-07-24T23:14:29-07:00"

time_obj=datetime.datetime.strptime(time_str,'%Y-%m-%dT%H:%M:%S-%z').

但它给出了一个值错误,说“z”是一个错误的指令。

有什么解决办法吗?

【问题讨论】:

相关:How to parse an ISO 8601-formatted date in Python? 相关:Convert an RFC 3339 time to a standard Python timestamp 【参考方案1】:

Python 2 strptime() 函数确实不支持 %z 时区格式(因为底层 time.strptime() function 不支持它)。你有两个选择:

使用strptime解析时忽略时区:

time_obj = datetime.datetime.strptime(time_str[:19], '%Y-%m-%dT%H:%M:%S')

使用dateutil module,它的解析函数确实处理时区:

from dateutil.parser import parse
time_obj = parse(time_str)

命令提示符下的快速演示:

>>> from dateutil.parser import parse
>>> parse("2012-07-24T23:14:29-07:00")
datetime.datetime(2012, 7, 24, 23, 14, 29, tzinfo=tzoffset(None, -25200))

您还可以升级到 Python 3.2 或更新版本,其中时区支持已经改进到 %z 可以工作,前提是您从输入中删除最后一个 :,并从 @ 之前删除 - 987654334@:

>>> import datetime
>>> time_str = "2012-07-24T23:14:29-07:00"
>>> datetime.datetime.strptime(time_str, '%Y-%m-%dT%H:%M:%S%z')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/mj/Development/Library/buildout.python/parts/opt/lib/python3.4/_strptime.py", line 500, in _strptime_datetime
    tt, fraction = _strptime(data_string, format)
  File "/Users/mj/Development/Library/buildout.python/parts/opt/lib/python3.4/_strptime.py", line 337, in _strptime
    (data_string, format))
ValueError: time data '2012-07-24T23:14:29-07:00' does not match format '%Y-%m-%dT%H:%M:%S%z'
>>> ''.join(time_str.rsplit(':', 1))
'2012-07-24T23:14:29-0700'
>>> datetime.datetime.strptime(''.join(time_str.rsplit(':', 1)), '%Y-%m-%dT%H:%M:%S%z')
datetime.datetime(2012, 7, 24, 23, 14, 29, tzinfo=datetime.timezone(datetime.timedelta(-1, 61200)))

【讨论】:

不幸的是,parse 不满意默认的 apache 日志日期 parser.parse('24/Jun/2015:00:01:03 +0200') 所以这赢得了互联网,即愉快地解析 apache 日志文件时间戳parser.parse('24/Jun/2015:00:01:03 +0200'.replace(':',' ',1))【参考方案2】:

在 Python 3.7+ 中:

from datetime import datetime

time_str = "2012-07-24T23:14:29-07:00"
dt_aware = datetime.fromisoformat(time_str)
print(dt_aware.isoformat('T'))
# -> 2012-07-24T23:14:29-07:00

在 Python 3.2+ 中:

from datetime import datetime

time_str = "2012-07-24T23:14:29-0700"
dt_aware = datetime.strptime(time_str, '%Y-%m-%dT%H:%M:%S%z')
print(dt_aware.isoformat('T'))
# -> 2012-07-24T23:14:29-07:00

注意:在 Python 3.7 之前,此变体在 -0700 部分不支持 :(rfc 3339 允许这两种格式)。见datetime: add ability to parse RFC 3339 dates and times。

在 Python 2.7 等较旧的 Python 版本上,您可以手动解析 utc 偏移量:

from datetime import datetime

time_str = "2012-07-24T23:14:29-0700"
# split the utc offset part
naive_time_str, offset_str = time_str[:-5], time_str[-5:]
# parse the naive date/time part
naive_dt = datetime.strptime(naive_time_str, '%Y-%m-%dT%H:%M:%S')
# parse the utc offset
offset = int(offset_str[-4:-2])*60 + int(offset_str[-2:])
if offset_str[0] == "-":
   offset = -offset
dt = naive_dt.replace(tzinfo=FixedOffset(offset))
print(dt.isoformat('T'))

FixedOffset class is defined here.

【讨论】:

【参考方案3】:

ValueError: 'z' is a bad directive in format...

(注意:在我的情况下,我必须坚持使用 python 2.7)

我在从 git log --date=iso8601 的输出解析提交日期时遇到了类似的问题,这实际上不是 ISO8601 格式(因此在更高版本中添加了 --date=iso8601-strict)。

由于我使用的是django,我可以利用那里的实用程序。

https://github.com/django/django/blob/master/django/utils/dateparse.py

>>> from django.utils.dateparse import parse_datetime
>>> parse_datetime('2013-07-23T15:10:59.342107+01:00')
datetime.datetime(2013, 7, 23, 15, 10, 59, 342107, tzinfo=+0100)

您可以使用自己的正则表达式来代替strptime

【讨论】:

【参考方案4】:

使用 python 3.5.2 转换26 Sep 2000 05:11:00 -0700

from datetime import datetime    
dt_obj = datetime.strptime("26 Sep 2000 05:11:00 -0700", '%d %b %Y %H:%M:%S %z')

转换2012-07-24T23:14:29 -0700

dt_obj = datetime.strptime('2012-07-24T23:14:29 -0700', '%Y-%m-%dT%H:%M:%S %z')

Python 3.5.2 不支持 -07:00 时间偏移 ':' 应该删除

【讨论】:

以上是关于使用 strptime 将带偏移量的时间戳转换为 datetime obj的主要内容,如果未能解决你的问题,请参考以下文章

将带时区的字符串转换为 unix 时间戳

转换为纪元时间戳添加小时偏移量

python中,有个字符串形式的时间戳,如何转换为日期呢

Qt 时间戳从 Epoch(1970) 到 2000 年开始的 Postgresql 时间戳。如何添加偏移量并将毫秒转换为微秒?

时区分钟偏移量的 TimeZoneInfo

Mongo ObjectID:即使使用 pytz,“也无法比较原始偏移量和可感知偏移量的日期时间”