全网最全深度盘点 Python 日期时间处理操作
Posted Python学习与数据挖掘
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了全网最全深度盘点 Python 日期时间处理操作相关的知识,希望对你有一定的参考价值。
在实际工作中,经常会用datetime库做日期时间处理操作。
对于每一张表,都会包含日期时间相关的字段,基于这些字段,便于我们从时间的维度来认识和分析业务,例如,按时间观察订单的变化;每日的UV和PV;每日的坏账率、通过率、件均额度等,以及按着周、月、季度或者年来观察一些关键指标。
在此,我分享一份datetime模块的学习资料,一起学习下。
Python的时间处理模块在日常的使用中用的较多多,但是使用的时候基本上都是要查资料,还是有些麻烦的,梳理下,便于以后方便的使用。喜欢记得关注、收藏、点赞。
【注】完整代码、数据、技术交流,文末获取
目录
-
时间相关概念
-
Python time模块
-
时间格式化
-
计时器功能
-
time模块其他内置函数
-
time模块包含的属性
-
datetime模块
-
date类
-
time类
-
datetime类
-
timedelta类
-
tzinfo类
-
pytz模块
-
时区转换
-
夏令时处理
-
dateutil模块
-
parser.parse()
-
rrule.rrule()
-
Arrow
-
UTC 时间
-
当地时间
-
解析时间
-
Unix 时间戳
-
格式化日期和时间
-
转换为区域时间
-
工作日
-
移动时间
-
夏令时
-
人性化的日期和时间
-
ISO 8601类
时间相关概念
秒 在1967年的第13届国际度量衡会议上决定以原子时定义的秒作为时间的国际标准单位:铯133原子基态的两个超精细能阶间跃迁对应辐射的9,192,631,770个周期的持续时间, 起始历元定在1958年1月1日0时。
原子钟是一种时钟,它以原子共振频率标准来计算及保持时间的准确。原子钟是世界上已知最准确的时间测量和频率标准。
GMT 格林威治标准时间(Greenwich Mean Time),是指位于伦敦郊区的皇家格林威治天文台的标准时间,因为本初子午线(Prime meridian)被定义为通过那里的经线。GMT也叫世界时UT。
UTC 协调世界时间(Coordinated Universal Time), 又称世界标准时间,基于国际原子钟,误差为每日数纳秒。协调世界时的秒长与原子时的秒长一致,在时刻上则要求尽量与世界时接近(规定二者的差值保持在 0.9秒以内)。
闰秒 不只有闰年,还有闰秒。闰秒是指为保持协调世界时接近于世界时时刻,由国际计量局统一规定在年底或年中(也可能在季末)对协调世界时增加或减少1秒的调整。由于地球自转的不均匀性和长期变慢性(主要由潮汐摩擦引起的),会使世界时(民用时)和原子时之间相差超过到±0.9秒时,就把世界时向前拨1秒(负闰秒,最后一分钟为59秒)或向后拨1秒(正闰秒,最后一分钟为61秒);闰秒一般加在公历年末或公历六月末。
时区 是地球上的区域使用同一个时间定义。有关国际会议决定将地球表面按经线从南到北,划分成24个时区,并且规定相邻区域的时间相差1小时。当人们跨过一个区域,就将自己的时钟校正1小时(向西减1小时,向东加1小时),跨过几个区域就加或减几小时。比如我大中国处于东八区,表示为GMT+8。
夏令时 (Daylight Saving Time:DST),又称日光节约时制、日光节约时间或夏令时间。这是一种为节约能源而人为规定地方时间的制度,在夏天的时候,白天的时间会比较长,所以为了节约用电,因此在夏天的时候某些地区会将他们的时间定早一小时,也就是说,原本时区是8点好了,但是因为夏天太阳比较早出现,因此把时间向前挪,在原本8点的时候,订定为该天的9点(时间提早一小时)~如此一来,我们就可以利用阳光照明,省去了花费电力的时间,因此才会称之为夏季节约时间!
Unix时间戳 指的是从协调世界时(UTC)1970年1月1日0时0分0秒开始到现在的总秒数,不考虑闰秒。
Python time模块
在 Python 文档里,time是归类在Generic Operating System Services中,换句话说, 它提供的功能是更加接近于操作系统层面的。通读文档可知,time 模块是围绕着 Unix Timestamp 进行的。
该模块主要包括一个类 struct_time,另外其他几个函数及相关常量。需要注意的是在该模块中的大多数函数是调用了所在平台C library的同名函数, 所以要特别注意有些函数是平台相关的,可能会在不同的平台有不同的效果。另外一点是,由于是基于Unix Timestamp,所以其所能表述的日期范围被限定在 1970 – 2038 之间,如果你写的代码需要处理在前面所述范围之外的日期,那可能需要考虑使用datetime模块更好。
获取当前时间和转化时间格式
-
time() 返回时间戳格式的时间 (相对于1.1 00:00:00以秒计算的偏移量)
-
ctime() 返回字符串形式的时间,可以传入时间戳格式时间,用来做转化
-
asctime() 返回字符串形式的时间,可以传入struct_time形式时间,用来做转化
-
localtime() 返回当前时间的struct_time形式,可传入时间戳格式时间,用来做转化
-
gmtime() 返回当前时间的struct_time形式,UTC时区(0时区) ,可传入时间戳格式时间,用来做转化
>>> import time
>>> time.time()
1473386416.954
>>> time.ctime()
'Fri Sep 09 10:00:25 2016'
>>> time.ctime(time.time())
'Fri Sep 09 10:28:08 2016'
>>> time.asctime()
'Fri Sep 09 10:22:40 2016'
>>> time.asctime(time.localtime())
'Fri Sep 09 10:33:00 2016'
>>> time.localtime()
time.struct_time(tm_year=2016, tm_mon=9, tm_mday=9, tm_hour=10, tm_min=1, tm_sec=19, tm_wday=4, tm_yday=253, tm_isdst=0)
>>> time.localtime(time.time())
time.struct_time(tm_year=2016, tm_mon=9, tm_mday=9, tm_hour=10, tm_min=19, tm_sec=11, tm_wday=4, tm_yday=253, tm_isdst=0)
>>> time.gmtime()
time.struct_time(tm_year=2016, tm_mon=9, tm_mday=9, tm_hour=2, tm_min=13, tm_sec=10, tm_wday=4, tm_yday=253, tm_isdst=0)
>>> time.gmtime(time.time())
time.struct_time(tm_year=2016, tm_mon=9, tm_mday=9, tm_hour=2, tm_min=15, tm_sec=35, tm_wday=4, tm_yday=253, tm_isdst=0)
struct_time共有9个元素,其中前面6个为年月日时分秒,后面三个分别代表的含义为:
-
tm_wday 一周的第几天(周日是0)
-
tm_yday 一年的第几天
-
tm_isdst 是否是夏令时
时间格式化
time.mktime()
将一个以struct_time格式转换为时间戳
>>> time.mktime(time.localtime())
1473388585.0
time.strftime(format[,t]) 把一个struct_time时间转化为格式化的时间字符串。如果t未指定,将传入time.localtime()。如果元组中任何一个元素越界,ValueError的错误将会被抛出。
-
%c 本地相应的日期和时间表示
-
%x 本地相应日期
-
%X 本地相应时间
-
%y 去掉世纪的年份(00 – 99)
-
%Y 完整的年份
-
%m 月份(01 – 12)
-
%b 本地简化月份名称
-
%B 本地完整月份名称
-
%d 一个月中的第几天(01 – 31)
-
%j 一年中的第几天(001 – 366)
-
%U 一年中的星期数。(00 – 53星期天是一个星期的开始。)第一个星期天之前的所有天数都放在第0周。
-
%W 和%U基本相同,不同的是%W以星期一为一个星期的开始。
-
%w 一个星期中的第几天(0 – 6,0是星期天)
-
%a 本地(locale)简化星期名称
-
%A 本地完整星期名称
-
%H 一天中的第几个小时(24小时制,00 – 23)
-
%I 第几个小时(12小时制,01 – 12)
-
%p 本地am或者pm的相应符,“%p”只有与“%I”配合使用才有效果。
-
%M 分钟数(00 – 59)
-
%S 秒(01 – 61),文档中强调确实是0 – 61,而不是59,闰年秒占两秒
-
%Z 时区的名字(如果不存在为空字符)
-
%% ‘%’字符
>>> time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
'2016-09-09 10:54:21'
time.strptime(string[,format])
把一个格式化时间字符串转化为struct_time。实际上它和strftime()是逆操作。
>>> time.strptime(time.ctime())
time.struct_time(tm_year=2016, tm_mon=9, tm_mday=9, tm_hour=11, tm_min=0, tm_sec=4, tm_wday=4, tm_yday=253, tm_isdst=-1)
计时器功能
time.sleep(secs)
线程推迟指定的时间运行。单位为秒。
time.clock()
这个需要注意,在不同的系统上含义不同。在UNIX系统上,它返回的是“进程时间”,它是用秒表示的浮点数(时间戳)。而在WINDOWS中,第一次调用,返回的是进程运行的实际时间。而第二次之后的调用是自第一次调用以后到现在的运行时间。(实际上是以WIN32上QueryPerformanceCounter()为基础,它比毫秒表示更为精确)
import time
time.sleep(1)
print("clock1:%s" % time.clock())
time.sleep(1)
print("clock2:%s" % time.clock())
time.sleep(1)
print("clock3:%s" % time.clock())
运行结果为:
clock1:1.57895443216e-06
clock2:1.00064381867
clock3:2.00158724394
其中第一个clock()输出的是程序运行时间,第二、三个clock()输出的都是与第一个clock的时间间隔
time模块其他内置函数
-
altzone() 返回格林威治西部的夏令时地区的偏移秒数。如果该地区在格林威治东部会返回负值(如西欧,包括英国)。对夏令时启用地区才能使用。
-
tzset() 根据环境变量TZ重新初始化时间相关设置。
time模块包含的属性
-
timezone 是当地时区(未启动夏令时)距离格林威治的偏移秒数(>0,美洲;<=0大部分欧洲,亚洲,非洲)。
-
tzname 包含一对根据情况的不同而不同的字符串,分别是带夏令时的本地时区名称和不带的。
import time
print(time.timezone)
print(time.tzname)
print(time.tzname[0].decode("GBK"))
print(time.tzname[1].decode("GBK"))
运行结果
-28800
('\\xd6\\xd0\\xb9\\xfa\\xb1\\xea\\xd7\\xbc\\xca\\xb1\\xbc\\xe4', '\\xd6\\xd0\\xb9\\xfa\\xcf\\xc4\\xc1\\xee\\xca\\xb1')
中国标准时间
中国夏令时
datetime模块
datetime 比 time 高级了不少,可以理解为 datetime 基于 time 进行了封装,提供了更多实用的函数。
datetime模块定义了下面这几个类:
-
date:表示日期的类。常用的属性有year, month, day
-
time:表示时间的类。常用的属性有hour, minute, second, microsecond
-
datetime:表示日期时间
-
timedelta:表示时间间隔,即两个时间点之间的长度
-
tzinfo:与时区有关的相关信息
注:上面这些类型的对象都是不可变(immutable)的。
date类
date类定义了一些常用的类方法与类属性:
-
max、min:date对象所能表示的最大、最小日期
-
resolution:date对象表示日期的最小单位。这里是天
-
today():返回一个表示当前本地日期的date对象
-
fromtimestamp(timestamp):根据给定的时间戮,返回一个date对象
-
fromordinal(ordinal):将Gregorian日历时间转换为date对象(特殊历法用不上)
from datetime import date
import time
print('date.max:', date.max)
print('date.min:', date.min)
print('date.resolution:', date.resolution)
print('date.today():', date.today())
print('date.fromtimestamp():', date.fromtimestamp(time.time()))
执行结果:
date.max: 9999-12-31
date.min: 0001-01-01
date.resolution: 1 day, 0:00:00
date.today(): 2016-09-12
date.fromtimestamp(): 2016-09-12
date提供的实例方法和属性:
-
.year:返回年
-
.month:返回月
-
.day:返回日
-
.replace(year, month, day):生成一个新的日期对象,用参数指定的年,月,日代替原有对象中的属性。(原有对象仍保持不变)
-
.weekday():返回weekday,如果是星期一,返回0;如果是星期2,返回1,以此类推
-
.isoweekday():返回weekday,如果是星期一,返回1;如果是星期2,返回2,以此类推
-
.isocalendar():返回格式如(year, wk num, wk day)
-
.isoformat():返回格式如’YYYY-MM-DD’的字符串
-
.strftime(fmt):自定义格式化字符串。与time模块中的strftime类似。
-
.toordinal():返回日期对应的Gregorian Calendar日期
from datetime import date
today = date.today()
print('today:', today)
print('.year:', today.year)
print('.month:', today.month)
print('.replace():', today.replace(year=2017) )
print('.weekday():', today.weekday())
print('.isoweekday():', today.isoweekday())
print('.isocalendar():', today.isocalendar())
print('.isoformat():', today.isoformat())
print('.strftime():', today.strftime('%Y-%m-%d') )
print('.toordinal():', today.toordinal())
执行结果:
today: 2016-09-12
.year: 2016
.month: 9
.replace(): 2017-09-12
.weekday(): 0
.isoweekday(): 1
.isocalendar(): (2016, 37, 1)
.isoformat(): 2016-09-12
.strftime(): 2016-09-12
.toordinal(): 736219
date还对某些操作进行了重载,它允许我们对日期进行如下一些操作:
-
date2 = date1 + timedelta # 日期加上一个间隔,返回一个新的日期对象
-
date2 = date1 – timedelta # 日期减去一个间隔,返回一个新的日期对象
-
timedelta = date1 – date2 # 两个日期相减,返回一个时间间隔对象
-
date1 < date2 # 两个日期进行比较
time类
time类的构造函数如下:(其中参数tzinfo,它表示时区信息。)
class datetime.time(hour[, minute[, second[, microsecond[, tzinfo]]]])
time类定义的类属性:
-
min、max:time类所能表示的最小、最大时间。其中,time.min = time(0, 0, 0, 0), time.max = time(23, 59, 59, 999999)
-
resolution:时间的最小单位,这里是1微秒
time类提供的实例方法和属性:
-
.hour、.minute、.second、.microsecond:时、分、秒、微秒
-
.tzinfo:时区信息
-
.replace([hour[, minute[, second[, microsecond[, tzinfo]]]]]):创建一个新的时间对象,用参数指定的时、分、秒、微秒代替原有对象中的属性(原有对象仍保持不变);
-
.isoformat():返回型如”HH:MM:SS”格式的字符串表示;
-
.strftime(fmt):返回自定义格式化字符串。
像date一样,也可以对两个time对象进行比较,或者相减返回一个时间间隔对象。这里就不提供例子了。
datetime类
datetime是date与time的结合体,包括date与time的所有信息。它的构造函数如下:datetime.datetime(year, month, day[, hour[, minute[, second[, microsecond[, tzinfo]]]]]),各参数的含义与date、time的构造函数中的一样,要注意参数值的范围。
datetime类定义的类属性与方法:
-
min、max:datetime所能表示的最小值与最大值;
-
resolution:datetime最小单位;
-
today():返回一个表示当前本地时间的datetime对象;
-
now([tz]):返回一个表示当前本地时间的datetime对象,如果提供了参数tz,则获取tz参数所指时区的本地时间;
-
utcnow():返回一个当前utc时间的datetime对象;
-
fromtimestamp(timestamp[, tz]):根据时间戮创建一个datetime对象,参数tz指定时区信息;
-
utcfromtimestamp(timestamp):根据时间戮创建一个datetime对象;
-
combine(date, time):根据date和time,创建一个datetime对象;
-
strptime(date_string, format):将格式字符串转换为datetime对象;
from datetime import datetime
import time
print('datetime.max:', datetime.max)
print('datetime.min:', datetime.min)
print('datetime.resolution:', datetime.resolution)
print('today():', datetime.today())
print('now():', datetime.now())
print('utcnow():', datetime.utcnow())
print('fromtimestamp(tmstmp):', datetime.fromtimestamp(time.time()))
print('utcfromtimestamp(tmstmp):', datetime.utcfromtimestamp(time.time()))
运行结果:
datetime.max: 9999-12-31 23:59:59.999999
datetime.min: 0001-01-01 00:00:00
datetime.resolution: 0:00:00.000001
today(): 2016-09-12 19:57:00.761000
now(): 2016-09-12 19:57:00.761000
utcnow(): 2016-09-12 11:57:00.761000
fromtimestamp(tmstmp): 2016-09-12 19:57:00.761000
utcfromtimestamp(tmstmp): 2016-09-12 11:57:00.761000
datetime类提供的实例方法与属性(很多属性或方法在date和time中已经出现过,在此有类似的意义,这里只罗列这些方法名,具体含义不再逐个展开介绍,可以参考上文对date与time类的讲解。):
year、month、day、hour、minute、second、microsecond、tzinfo:
-
date():获取date对象;
-
time():获取time对象;
-
replace([year[, month[, day[, hour[, minute[, second[, microsecond[, tzinfo]]]]]]]]):
-
timetuple()
-
utctimetuple()
-
toordinal()
-
weekday()
-
isocalendar()
-
isoformat([sep])
-
ctime():返回一个日期时间的C格式字符串,等效于ctime(time.mktime(dt.timetuple()));
-
strftime(format)
像date一样,也可以对两个datetime对象进行比较,或者相减返回一个时间间隔对象,或者日期时间加上一个间隔返回一个新的日期时间对象。
timedelta类
通过timedelta函数返回一个timedelta对象,也就是一个表示时间间隔的对象。函数参数情况如下所示:
class datetime.timedelta([days[, seconds[, microseconds[, milliseconds[, minutes[, hours[, weeks]]]]]]])
其没有必填参数,简单控制的话第一个整数就是多少天的间隔的意思:
datetime.timedelta(10)
两个时间间隔对象可以彼此之间相加或相减,返回的仍是一个时间间隔对象。而更方便的是一个datetime对象如果减去一个时间间隔对象,那么返回的对应减去之后的datetime对象,然后两个datetime对象如果相减返回的是一个时间间隔对象。这很是方便。
tzinfo类
tzinfo是一个抽象类,不能被直接实例化。需要派生子类,提供相应的标准方法。datetime模块并不提供tzinfo的任何子类。最简单的方式是使用pytz模块。
pytz模块
pytz是Python的一个时区处理模块(同时也包括夏令时),在理解时区处理模块之前,需要先要了解一些时区的概念。
要知道时区之间的转换关系,其实这很简单:把当地时间减去当地时区,剩下的就是格林威治时间了。例如北京时间的18:00就是18:00+08:00,相减以后就是10:00+00:00,因此就是格林威治时间的10:00。
Python的datetime可以处理2种类型的时间,分别为offset-naive和offset-aware。前者是指没有包含时区信息的时间,后者是指包含时区信息的时间,只有同类型的时间才能进行减法运算和比较。
datetime模块的函数在默认情况下都只生成offset-naive类型的datetime对象,例如now()、utcnow()、fromtimestamp()、utcfromtimestamp()和strftime()。其中now()和fromtimestamp()可以接受一个tzinfo对象来生成offset-aware类型的datetime对象,但是标准库并不提供任何已实现的tzinfo类,只能自己实现。
下面就是实现格林威治时间和北京时间的tzinfo类的例子:
ZERO_TIME_DELTA = timedelta(0)
LOCAL_TIME_DELTA = timedelta(hours=8) # 本地时区偏差
class UTC(tzinfo):
def utcoffset(self, dt):
return ZERO_TIME_DELTA
def dst(self, dt):
return ZERO_TIME_DELTA
class LocalTimezone(tzinfo):
def utcoffset(self, dt):
return LOCAL_TIME_DELTA
def dst(self, dt):
return ZERO_TIME_DELTA
def tzname(self, dt):
return '+08:00'
一个tzinfo类需要实现utcoffset、dst和tzname这3个方法。其中utcoffset需要返回夏时令的时差调整;tzname需要返回时区名,如果你不需要用到的话,也可以不实现。
一旦生成了一个offset-aware类型的datetime对象,我们就能调用它的astimezone()方法,生成其他时区的时间(会根据时差来计算)。而如果拿到的是offset-naive类型的datetime对象,也是可以调用它的replace()方法来替换tzinfo的,只不过这种替换不会根据时差来调整其他时间属性。因此,如果拿到一个格林威治时间的offset-naive类型的datetime对象,直接调用replace(tzinfo=UTC())即可转换成offset-aware类型,然后再调用astimezone()生成其他时区的datetime对象。
看上去一切都很简单,但不知道你还是否记得上文所述的夏时令。提起夏时令这个玩意,真是让我头疼,因为它没有规则可循:有的国家实行夏时令,有的国家不实行,有的国家只在部分地区实行夏时令,有的地区只在某些年实行夏时令,每个地区实行夏时令的起止时间都不一定相同,而且有的地方TMD还不是用几月几日来指定夏时令的起止时间的,而是用某月的第几个星期几这种形式。
pytz模块,使用Olson TZ Database解决了跨平台的时区计算一致性问题,解决了夏令时带来的计算问题。由于国家和地区可以自己选择时区以及是否使用夏令时,所以pytz模块在有需要的情况下得更新自己的时区以及夏令时相关的信息。
pytz提供了全部的timezone信息,如:
import pytz
print(len(pytz.all_timezones))
print(len(pytz.common_timezones))
运行结果:
588
436
如果需要获取某个国家的时区,可以使用如下方式:
import pytz
print(pytz.country_timezones('cn'))
执行结果:
[u’Asia/Shanghai’, u’Asia/Urumqi’]
中国一个有两个时区,一个为上海,一个为乌鲁木齐,我们来看下我们有什么区别:
from datetime import datetime
import pytz
print(pytz.country_timezones('cn'))
tz1 = pytz.timezone(pytz.country_timezones('cn')[0])
print(tz1)
print(datetime.now(tz1))
tz2 = pytz.timezone(pytz.country_timezones('cn')[1])
print(tz2)
print(datetime.now(tz2))
执行结果:
[u'Asia/Shanghai', u'Asia/Urumqi']
Asia/Shanghai
2016-09-14 09:55:39.384000+08:00
Asia/Urumqi
2016-09-14 07:55:39.385000+06:00
可以看到上海是东八区,而乌鲁木齐是东六区。
时区转换
操作起来有而比较简单,本地时区与UTC的互转:
from datetime import datetime
import pytz
now = datetime.now()
tz = pytz.timezone('Asia/Shanghai')
print(tz.localize(now))
print(pytz.utc.normalize(tz.localize(now)))
执行结果:
2016-09-14 10:25:44.633000+08:00
2016-09-14 02:25:44.633000+00:00
使用astimezone()可以进行时区与时区之间的转换。
from datetime import datetime
import pytz
utc = pytz.utc
beijing_time = pytz.timezone('Asia/Shanghai')
japan_time = pytz.timezone('Asia/Tokyo')
now = datetime.now(beijing_time)
print("Beijing Time:",now)
print("UTC:",now.astimezone(utc全网最全的新型数据库多维表格平台盘点 NotionFlowUsAirtableSeaTable维格表 Vika飞书多维表格黑帕云织信 Informat语雀
#yyds干货盘点#肝帝一周总结:全网最全最细☀️Mysql 索引数据结构详解与索引优化☀️《❤️记得收藏❤️》
全网最全的低代码/无代码平台盘点:简道云伙伴云明道云轻流速融云集简云Treelab钉钉·宜搭腾讯云·微搭智能云·爱速搭百数云
干货建议收藏! ! !全网最全的Python.openpyxl操作Excel数据