python - 如何在没有dateutil的情况下将时区感知字符串转换为Python中的日期时间?

Posted

技术标签:

【中文标题】python - 如何在没有dateutil的情况下将时区感知字符串转换为Python中的日期时间?【英文标题】:How to convert a timezone aware string to datetime in Python without dateutil? 【发布时间】:2012-10-22 08:03:10 【问题描述】:

我必须将"2012-11-01T04:16:13-04:00" 等可识别时区的字符串转换为 Python datetime 对象。

我看到了dateutil 模块,它有一个解析函数,但我真的不想使用它,因为它添加了一个依赖项。

那我该怎么做呢?我尝试了类似以下的方法,但没有运气。

datetime.datetime.strptime("2012-11-01T04:16:13-04:00", "%Y-%m-%dT%H:%M:%S%Z")

【问题讨论】:

当依赖项精确地满足您的要求时,添加依赖项有什么问题?当然,如果没有额外的模块也能达到同样的效果,那么模块就没有理由存在了,对吗?添加依赖项对您来说有多难? 我认为这可能是个人恩惠?我真的不想在项目中引入整个大模块,因为我只需要一个很小的单个函数。 向项目添加依赖项的具体成本是多少,与使代码难以理解的成本相比。忽略您当前只需要一个功能这一事实 - 专注于成本。 【参考方案1】:

您可以创建一个时区不感知对象并替换 tzinfo 并使其成为时区感知 DateTime 对象。

from datetime import datetime
import pytz

unware_time = datetime.strptime("2012-11-01 04:16:13", "%Y-%m-%d %H:%M:%S")
aware_time = unaware_time.replace(tzinfo=pytz.UTC)

【讨论】:

这是最简单的方法,但一直困扰我的是你创建了两次datetime 对象,因为replace 只是简单地替换了 tzinfo,它创建一个全新的对象。另外,从 Python 3.2 开始,你可以使用datetime.timezone.utc,不需要 pytz。【参考方案2】:

Mohideen bin Mohammed 提出的使用 dateutil 的建议绝对是最好的解决方案,即使它确实需要一个小型库。在那里使用其他方法容易出现各种形式的失败。这是一个很好的函数。

from dateutil.parser import parse


def parse_date_convert(date, fmt=None):
    if fmt is None:
        fmt = '%Y-%m-%d %H:%M:%S' # Defaults to : 2022-08-31 07:47:30
    get_date_obj = parse(str(date))
    return str(get_date_obj.strftime(fmt))

dates = ['2022-08-31T07:47:30Z','2022-08-31T07:47:29.098Z','2017-05-27T07:20:18.000-04:00','2012-11-01T04:16:13-04:00']

for date in dates:
    print(f'Before: date  After: parse_date_convert(date)')

结果:

Before: 2022-08-31T07:47:30Z  After: 2022-08-31 07:47:30
Before: 2022-08-31T07:47:29.098Z  After: 2022-08-31 07:47:29
Before: 2017-05-27T07:20:18.000-04:00  After: 2017-05-27 07:20:18
Before: 2012-11-01T04:16:13-04:00  After: 2012-11-01 04:16:13

尝试过各种形式,例如像这样用切片分割替换 T Z:

dates = ['2022-08-31T07:47:30Z','2022-08-31T07:47:29.098Z','2017-05-27T07:20:18.000-04:00','2012-11-01T04:16:13-04:00']

for date in dates:
    print(f'Before: date  After: date.replace("T", " ").replace("Z", "")')

你仍然得到低于标准的结果。像下面这样

Before: 2022-08-31T07:47:30Z  After: 2022-08-31 07:47:30
Before: 2022-08-31T07:47:29.098Z  After: 2022-08-31 07:47:29.098
Before: 2017-05-27T07:20:18.000-04:00  After: 2017-05-27 07:20:18.000-04:00
Before: 2012-11-01T04:16:13-04:00  After: 2012-11-01 04:16:13-04:00

【讨论】:

【参考方案3】:

你可以这样转换。

date = datetime.datetime.strptime('2019-3-16T5-49-52-595Z','%Y-%m-%dT%H-%M-%S-%f%z')
date_time = date.strftime('%Y-%m-%dT%H:%M:%S.%fZ')

【讨论】:

【参考方案4】:

原始问题中的代码有两个问题:时区中不应有:,并且“时区作为偏移量”的格式字符串是小写%z不上%Z

这适用于我在 Python v3.6

>>> from datetime import datetime
>>> t = datetime.strptime("2012-11-01T04:16:13-0400", "%Y-%m-%dT%H:%M:%S%z")
>>> print(t)
2012-11-01 04:16:13-04:00

【讨论】:

错了,为什么print(t)在utc偏移上加冒号? @moooeeeep 因为默认日期时间使用isoformat(sep=' ') 用于__str__ 函数,它将UTC 偏移量打印为“+HH:MM”。使用print(t.strftime("%Y-%m-%dT%H:%M:%S%z")) 将打印时区中没有“:”。 在时区中有一个冒号并没有错。许多来源以字符串形式显示他们的时间:2012-11-01T04:16:13-04:00。 OP 正在寻求解析该表单。【参考方案5】:

从 Python 3.7 开始,datetime.datetime.fromisoformat() 可以处理您的格式:

>>> import datetime
>>> datetime.datetime.fromisoformat('2012-11-01T04:16:13-04:00')
datetime.datetime(2012, 11, 1, 4, 16, 13, tzinfo=datetime.timezone(datetime.timedelta(days=-1, seconds=72000)))

在较旧的 Python 版本中,您无法做到这一点,而且需要大量艰苦的手动时区定义。

Python 不包含时区数据库,因为它会很快过时。相反,Python 依赖于可以具有更快发布周期的外部库来为您提供正确配置的时区。

作为副作用,这意味着时区解析也需要是一个外部库。如果dateutil 对您来说太重了,请改用iso8601,它会很好地解析您的特定格式:

>>> import iso8601
>>> iso8601.parse_date('2012-11-01T04:16:13-04:00')
datetime.datetime(2012, 11, 1, 4, 16, 13, tzinfo=<FixedOffset '-04:00'>)

iso8601 是一个 惊人的 4KB 小。比较 python-dateutil 的 148KB。

从 Python 3.2 开始,Python 可以处理简单的基于偏移的时区,%z 将在时间戳中解析 -hhmm+hhmm 时区偏移。这意味着对于 ISO 8601 时间戳,您必须删除时区中的 :

>>> from datetime import datetime
>>> iso_ts = '2012-11-01T04:16:13-04:00'
>>> datetime.strptime(''.join(iso_ts.rsplit(':', 1)), '%Y-%m-%dT%H:%M:%S%z')
datetime.datetime(2012, 11, 1, 4, 16, 13, tzinfo=datetime.timezone(datetime.timedelta(-1, 72000)))

Python issue 15873 中正在跟踪缺乏正确的 ISO 8601 解析。

【讨论】:

在我看来 datetime 可以包含类似 iso8601 的东西来处理 ISO 8601 时区——一些解析和两个 tzinfo 子类。 @eryksun: ISO8601 对时区非常简单,但是一旦你在 python 标准库中包含了这些偏移量,你就会被为什么现实生活中的时区(不仅仅是一个偏移量)的误解所淹没) 不工作,等等。 定义一个FixedOffset 类并没有那么痛苦。这是code example Python 3.9, fromisoformat 在字符串中的 Z 或时间中的小数处失败` @Jashwant:在任何 Python 版本中都会失败。如果您必须使用Z 接受字符串,请使用isoformattedstring.replace("Z", "+00:00")。不知道您所说的时间小数是什么意思。【参考方案6】:

这是使用 dateutil 包的日期时间对象的 Python Doc..

from dateutil.parser import parse

get_date_obj = parse("2012-11-01T04:16:13-04:00")
print get_date_obj

【讨论】:

这应该是在没有外部库的情况下这样做的正确答案 @Paullo python-dateutil 正是“外部库”。 最佳答案对我来说没有尾随的“Z”,但这个答案可以。【参考方案7】:

我是 Python 新手,但找到了一种转换方法

2017-05-27T07:20:18.000-04:00

2017-05-27T07:20:18 无需下载新的实用程序。

from datetime import datetime, timedelta

time_zone1 = int("2017-05-27T07:20:18.000-04:00"[-6:][:3])
>>returns -04

item_date = datetime.strptime("2017-05-27T07:20:18.000-04:00".replace(".000", "")[:-6], "%Y-%m-%dT%H:%M:%S") + timedelta(hours=-time_zone1)

我确信有更好的方法可以做到这一点,而无需过多地切割字符串,但这完成了工作。

【讨论】:

以上是关于python - 如何在没有dateutil的情况下将时区感知字符串转换为Python中的日期时间?的主要内容,如果未能解决你的问题,请参考以下文章

使用 Python dateutil,如何判断时区字符串是不是“有效”?

Python日期时间通用匹配工具dateutil,匹配中文

python 时区 dateutil

Python3.x:日期库dateutil简介

升级 Python 包 dateutil:找不到版本

python基础教程Python 常用日期处理 -- calendar 与 dateutil 模块的使用