常用模块

Posted xinfan1

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了常用模块相关的知识,希望对你有一定的参考价值。

collections:

在内置数据类型(int,float,str,dict,list,tuple,set,bool)的基础上,collections模块还提供了几个数据类型:Counter、deque、defaultdict、namedtuple和OrderedDic等

1.namedtuple:生成可以使用名字来访问元素内容的tuple

2.deque:双端队列,可以快速的从另外一侧追加和推出对象

3:.Counter:计数器,主要用来计数

4.OrderedDict:有序字典

5.defaultdict:带有默认值的字典

namedtuple(具名元祖):

这个就是可以让你的元祖带有名字。

因为一个元祖(1,2)可以用来表示坐标,但如果没有标识谁知道呢。这个时候namedtuple就派上了用场。

from clooections import namedtuple


point = namedtuple(point,[x,y])或namedtuple(point,x y)
可以为字符串但必须要空格隔开。
p = point(1,2)
print(p)  # point(x=1,y=2)

还可以用具名元祖来记录一个城市的信息

 from collections import namedtuple
City = namedtuple(City, name country population coordinates)  # 第一个是类名,第二个是类的各个字段的名字。后者可以是由数个字符串组成的可迭代对象,或者是由空格分隔开的字段名组成的字符串
tokyo = City(Tokyo, JP, 36.933, (35.689722, 139.691667)) 
print(tokyo)
City(name=Tokyo, country=JP, population=36.933, coordinates=(35.689722, 139.691667))
 from collections import namedtuple
City = namedtuple(City, name country population coordinates)  # 第一个是类名,第二个是类的各个字段的名字。后者可以是由数个字符串组成的可迭代对象,或者是由空格分隔开的字段名组成的字符串
tokyo = City(Tokyo, JP, 36.933, (35.689722, 139.691667)) 
print(tokyo)
City(name=Tokyo, country=JP, population=36.933, coordinates=(35.689722, 139.691667))

类似的,如果要坐标和半径表示一个圆,也可以用namedtuple定义

Circle = namedtuple(‘Circle‘, [‘x‘, ‘y‘, ‘r‘])

deque:(双端队列)

队列:先进先出

import queue

q = queue.Queue()

q.put(‘first‘)  往队列中添加值

q.get() 往队列中要值

如果队列中的值取完,还get去取,那么程序会在原地等待,直到取到了值才会停止。

deque双端队列

里面有五个用法

append:加在最末尾

appendleft:加在最左边

pop:取末尾的

popleft:取最左边的

insert 插值:插到指定索引,但这样是不符合的队列的规则的。队列不应该支持插队。

OrderedDict有序字典:

使用dict时,key是无序的,在对dict做迭代时,我们无法确定key的顺序

如果要保持顺序,可以用OrderedDict

from collections import OrderedDict
d = dict([(a, 1), (b, 2), (c, 3)])
d # dict的Key是无序的
a: 1, c: 3, b: 2
od = OrderedDict([(a, 1), (b, 2), (c, 3)])
od # OrderedDict的Key是有序的
OrderedDict([(a, 1), (b, 2), (c, 3)])

注意:orderedDict的key‘会按照插入的顺序排列,不是key‘的本身排序

od = OrderedDict()
od[z] = 1
od[y] = 2
od[x] = 3
od.keys() # 按照插入的Key的顺序返回
[z, y, x]

defaultdict有默认值字典:

使dict时,如果引用的Key不存在,就会抛出KeyError。如果希望key不存在时,返回一个默认值,就可以用defaultdict

from collections import defaultdict
dd = defaultdict(lambda: N/A)
dd[key1] = abc
dd[key1] # key1存在
abc
dd[key2] # key2不存在,返回默认值
N/A

Counter计数器:

Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。Counter类和其他语言的bags或multisets很相似

c = Counter(‘abcdeabcdabcaba‘)

print c  Counter(‘a‘: 5, ‘b‘: 4, ‘c‘: 3, ‘d‘: 2, ‘e‘: 1)

 

时间模块time:

time模块的三种表现形式:

1.时间戳(timestamp):通常来说时间戳表示从1970年1月1日0时0点0分0秒开始按秒计算偏移量。

运行time.time()返回的是一个float类型

2.格式化时间(format string):运行time.strtime(‘%Y-%m-%d  %X)输出就是现在的年月日,时分秒

%y 两位数的年份表示(00-99%Y 四位数的年份表示(000-9999%m 月份(01-12%d 月内中的一天(0-31%H 24小时制小时数(0-23%I 12小时制小时数(01-12%M 分钟数(00=59%S 秒(00-59%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身

3.结构化时间

time.localtime()

localtime将一个时间戳转换为当前时区的struct_time

time.localtime()

time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24

tm_hour=13, tm_mn=59, tm_sec=37, 

tm_wday=0, tm_yday=205, tm_isdst=0)

反结构化:mlctime

小结:时间戳是计算机能够识别的时间,格式化时间是让人能够看懂的时间,结构化时间是操作时间的。

datetime模块:

这个也是用来操作时间的

import datetime

# 自定义日期
res = datetime.date(2019, 7, 15)
print(res)  # 2019-07-15

# 获取本地时间
# 年月日
now_date = datetime.date.today()
print(now_date)  # 2019-07-01
# 年月日时分秒
now_time = datetime.datetime.today()
print(now_time)  # 2019-07-01 17:46:08.214170

# 无论是年月日,还是年月日时分秒对象都可以调用以下方法获取针对性的数据
# 以datetime对象举例
print(now_time.year)  # 获取年份2019
print(now_time.month)  # 获取月份7
print(now_time.day)  # 获取日1
print(now_time.weekday())  # 获取星期(weekday星期是0-6) 0表示周一
print(now_time.isoweekday())  # 获取星期(weekday星期是1-7) 1表示周一

# timedelta对象
# 可以对时间进行运算操作
import datetime

# 获得本地日期 年月日
tday = datetime.date.today()
# 定义操作时间 day=7 也就是可以对另一个时间对象加7天或者减少7点
tdelta = datetime.timedelta(days=7)

# 打印今天的日期
print(今天的日期:.format(tday))  # 2019-07-01
# 打印七天后的日期
print(从今天向后推7天:.format(tday + tdelta))  # 2019-07-08
# 总结:日期对象与timedelta之间的关系
"""
日期对象 = 日期对象 +/- timedelta对象
timedelta对象 = 日期对象 +/- 日期对象

验证:

"""
# 定义日期对象
now_date1 = datetime.date.today()
# 定义timedelta对象
lta = datetime.timedelta(days=6)
now_date2 = now_date1 + lta  # 日期对象 = 日期对象 +/- timedelta对象
print(type(now_date2))  # <class ‘datetime.date‘>
lta2 = now_date1 - now_date2  # timedelta对象 = 日期对象 +/- 日期对象
print(type(lta2))  # <class ‘datetime.timedelta‘>


# 小练习 计算举例今年过生日还有多少天
birthday = datetime.date(2019, 12, 21)
now_date = datetime.date.today()
days = birthday - now_date
print(生日:.format(birthday))
print(今天的日期:.format(tday))
print(距离生日还有天.format(days))


# 总结年月日时分秒及时区问题
import datetime

dt_today = datetime.datetime.today()
dt_now = datetime.datetime.now()
dt_utcnow = datetime.datetime.utcnow()  # UTC时间与我们的北京时间cha ju

print(dt_today)
print(dt_now)
print(dt_utcnow)

random随机数模块:

是一个用来获取随机数的模块

random.random()随机一个大于且小于的小数

random.uniform(1,3)随机一个大于1小于3的小数

random.randint(1,9)用来随机一个大于等于1小于等于9的整数

random.randrange(1,10,2)大于等于1且小于10之间的奇数

random.choice([1,2])随机返回的1或2

random.samole([1,2,3,4,2],2)列表中任意2个组合

random.shuffle()打乱次序

随机生成验证码

import random

def get_code(num):
        res = ""
        for i in range(num):
                d1 = chr(random.randint(65,90)
                d2 = chr(random.randint(97,122)
                d3 = str(random.randint(0,9)
                res+=random.choice([d1,d2,d3])
        return res

os模块:

是用来与操作系统打交道的

os.makedirs(dirname1/dirname2)    可生成多层递归目录
os.removedirs(dirname1)    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir(dirname)    生成单级目录;相当于shell中mkdir dirname
os.rmdir(dirname)    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir(dirname)    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat(path/filename)  获取文件/目录信息

os.system("bash command")  运行shell命令,直接显示
os.popen("bash command).read()  运行shell命令,获取执行结果
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd

os.path
os.path.abspath(path) 返回path规范化的绝对路径
os.path.split(path) 将path分割成目录和文件名二元组返回 
os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 
os.path.basename(path) 返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path)  如果path是绝对路径,返回True
os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后访问时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小

sys模块:

是与pythos解释器(应用程序)打交道的模块

sys.path.append()将某个路径添加到系统的环境变量中

sys.argv命令行参数list,第一个元素是程序本身路径

sys.exit(n)退出程序,正常退出时exit(0),错误退出sys.exit(1)

sys.version 获取python解释器程序的版本信息

sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值

sys.platform  返回操作系统平台名称

序列化模块:

序列:字符串

序列化:将数据类型转化为字符串形式

json模块:

json是一种跨语言的序列化,并且传输速度快。但只能用于传输小数据

四个方法:

dump:是将数据类型转为json格式的字符串并存到文件中

dumps:将数据类型转为json格式的字符串

loads:将json格式的字符串转成对应的数据类型

load:将json格式的字符串从文件中读出转成对应的数据类型

如果想把序列化的中文按中文存进去,要把ensure_ascii设置为False

pickle模块:

能够传输大数据,并且支持python中所有的类型,缺点:只能在python中使用

方法和上面一样,但要注意pickle序列化到文件时,文件打开的模式必须是b模式。

subprocess模块:

子进程模块,用于操作shell命令的

import subprocess
order = subprocess.Popen(‘终端命令‘, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
suc_res = order.stdout.read().decode(‘系统默认编码‘)
err_res = order.stderr.read().decode(‘系统默认编码‘)

order = subprocess.run(‘终端命令‘, shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
suc_res = order.stdout.decode(‘系统默认编码‘)
err_res = order.stderr.decode(‘系统默认编码‘)

里面的stdout是表示输出管道

stdin表示输入管道

stderr表示错误信息。

 

以上是关于常用模块的主要内容,如果未能解决你的问题,请参考以下文章

Python——常用模块

ansible使用笔记(二)常用命令使用及常用模块简介

常用模块

python常用模块

常用模块知识

python中常用的模块1