Python模块
Posted 曹艳飞
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python模块相关的知识,希望对你有一定的参考价值。
一、什么是模块
模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀。
模块分为三种:
1、自定义模块:自定义的模块,顾名思义,就是你自己写的python程序,我们知道python的代码都存在一个以".py"结尾的文件中的,我们这样命名一个python脚本,吧后缀去掉就是模块名称,这个就是自定义模块,我举个例子:我写了一个yinzhengjie.py的文件。里面的内容我们可以忽略,如果我们要导入这个模块的话直接导入yinzhengjie这个模块名称就好了;
2、内置模块:那么问题来了,我们学的cha(),id()等等所有的内置函数是模块吗?答案是否定的!不是!对内置函数不是内置模块,他们只是python解释器自带的一些功能,那么什么是内置模块呢?一会我会再我的博客中提到一些常用的内置模块;
3、开源模块:这个就很好解释了,python语言的官网提供了一个供应开发人员上传你的代码到服务器上(https://pypi.python.org/pypi),然后客户端只要在命令行中输入安装命令就可以随意的在shell或者cmd的python解释器中调用这个第三方模块,比如:pip install paramiko.
二、常用模块使用
1、collections模块
在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter、deque、defaultdict、namedtuple和OrderedDict等。
1.namedtuple: 生成可以使用名字来访问元素内容的tuple
2.deque: 双端队列,可以快速的从另外一侧追加和推出对象
3.Counter: 计数器,主要用来计数
4.OrderedDict: 有序字典
5.defaultdict: 带有默认值的字典
#!/usr/bin/python
# -*- encodeing:utf-8 -*-
# import collections
# 利用namedtuple将元祖里面的内容表示X,Y坐标
# pop = collections.namedtuple(\'pop\',[\'x\',\'y\'])
# pop1 = pop(1,2)
# print(pop1.x)
# print(pop1.y)
# print(pop1)
# 利用namedtuple显示只拍上的花色和数字:
# cart = collections.namedtuple(\'cart\',[\'花色\',\'数字\'])
# cart1 = cart(\'梅花\',4)
# print(cart1)
# 队列:规则先进先出
# import queue
# a = queue.Queue()
# a.put([2,4,3,5])
# a.put(1)
# a.put(2)
# print(a.get())
# # print(a.get())
# # print(a.get())
# #print(a.get()) # 一直取值,取到没有的话系统会一直停留此处,这种情况会造成阻塞
# print(a.qsize()) # 查看队列里面还有多少值没有取出
#双队列:可以对一个列表进项双向操作数据
# import collections
# a = collections.deque([1,2])
# a.append("caoyf") #从后面放入数据
# a.insert(2,"caosy")# 在索引为2的地方插入一个数据
# a.appendleft("caoqu")#从前面插入数据
# print(a.pop()) #从后面取值
# print(a.popleft()) #从前面取值
# print(a)
# 有序字典,字典本是无序的,如有特殊情况需要将字典有序这时可以使用OrderedDict进行操作
import collections
dic = collections.OrderedDict([(\'a\',1),(\'b\',2),(\'c\',3)])
print(dic)
2、时间模块
Python中,通常有这三种方式来表示时间:时间戳、元组(struct_time)、格式化的时间字符串:
time模块:
#!/usr/bin/env python
#_*_coding:utf-8_*_
import time
#1.测量处理器运算时间,不包括sleep时间,不稳定,mac上测不出来
print(time.process_time())
#2.返回与utc时间的时间差,以秒计算
print(time.altzone)
#3.返回默认时间格式
print(time.asctime())
#4.返回本地时间的struct_time对象格式
print(time.localtime())
#5.返回utc时间的struc时间对象格式
print(time.gmtime(time.time()-800000))
#6.返回本地时间格式,
print(time.asctime(time.localtime()))
#7.返回时间格式,同上
print(time.ctime())
#8.将日期字符串转成struct时间对象格式
string_2_struct = time.strptime("2016/05/22","%Y/%m/%d")
print(string_2_struct)
#9.将struct时间对象转成时间戳
struct_2_stamp = time.mktime(string_2_struct)
print(struct_2_stamp)
#10.将utc时间戳转换成struct_time格式
print(time.gmtime(time.time()-86640))
#11.将utc struct_time格式转成指定的字符串格式
print(time.strftime("%Y-%m-%d %H:%M:%S",time.gmtime()))
3、random模块
#!/usr/bin/python
# -*- encodeing:utf-8 -*-
import random
#随机小数
# print(random.random()) #默认取0-1之间的小数点
# print(random.uniform(1,18)) #取大于1且小于18的小数
#随机整数
# print(random.randint(1,20)) #大于等于1且小于等于20
# random.randrange(1,10,2) # 大于等于1且小于10之间的奇数
# 随机选择一个返回
# random.choice([1,\'48\',[8,2]]) # #1或者45或者[8,2]
#随机选择多个返回,返回的个数为函数的第二个参数
# random.sample([1,\'23\',[4,5]],2) # #列表元素任意2个组合
#打乱列表顺序
# item=[1,2,3,4,5]
# random.shuffle(item) # 打乱次序
# item
# random.shuffle(item)
# item
# 生成验证码
# a1 = \'\'
# for i in range(6):
# b = random.randrange(0,4) #
# if b != i:
# temp = chr(random.randint(97,122))
# else:
# temp = random.randint(0,9)
# a1 += str(temp)
# print(a1)
4、OS模块
\'\'\'
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd
os.curdir 返回当前目录: (\'.\')
os.pardir 获取当前目录的父目录字符串名:(\'..\')
os.makedirs(\'dirname1/dirname2\') 可生成多层递归目录
os.removedirs(\'dirname1\') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir(\'dirname\') 生成单级目录;相当于shell中mkdir dirname
os.rmdir(\'dirname\') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir(\'dirname\') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove() 删除一个文件
os.rename("oldname","newname") 重命名文件/目录
os.stat(\'path/filename\') 获取文件/目录信息
os.sep 输出操作系统特定的路径分隔符,win下为"\\\\",Linux下为"/"
os.linesep 输出当前平台使用的行终止符,win下为"\\t\\n",Linux下为"\\n"
os.pathsep 输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name 输出字符串指示当前使用平台。win->\'nt\'; Linux->\'posix\'
os.system("bash command") 运行shell命令,直接显示
os.popen("bash command).read() 运行shell命令,获取执行结果
os.environ 获取系统环境变量
os.path
os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以/或\\结尾,那么就会返回空值。
即os.path.split(path)的第二个元素
os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path) 如果path是绝对路径,返回True
os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path) 返回path所指向的文件或者目录的最后访问时间
os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小
5、sys模块
sys.argv 命令行参数List,第一个元素是程序本身路径
sys.exit(n) 退出程序,正常退出时exit(0),错误退出sys.exit(1)
sys.version 获取Python解释程序的版本信息
sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform 返回操作系统平台名称
6、什么是序列化
将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化。
1、序列化的作用:
以某种存储形式使自定义对象持久化;
将对象从一个地方传递到另一个地方;
使程序更具有维护性
2、JSON模块:json提供了dumps loads dump load
2.1dumps与loads
根据下面的实例分析dumps是将一个字典里面的内容转换为字符串,loads是将字符串格式的字典转换为一个字典:(注意:json转换完的字符串类型的字典值中的字符串是有双引号" "表示的),实例如下:
#!/usr/bin/python # -*- encodeing:utf-8 -*- import json,pickle,time,shelve # dic = {\'k1\':1,\'k2\':2,\'k3\':4} # str_dic = json.dumps(dic) #将字典转换为字符串,转换出来的字符串是双引号表示的。 # print(type(dic),dic) # print(type(str_dic),str_dic) # # dic1 = json.loads(str_dic) # 将字符串转换为字典 # print(type(dic1),dic1) dumps和loads
2.2dump与load,
dump与load是和文件有关,使用dump和load以文件的读和写方式进行,实例如下:
#!/usr/bin/python # -*- encodeing:utf-8 -*- import json,pickle,time,shelve f = open("caoyf","w",encoding="utf-8") dic = {\'k1\':1,\'k2\':2,\'k3\':4} json.dump(dic,f) #dump是接收一个句柄,将字典以字符串的形式写入到文件中 f.close() f = open("caoyf",encoding="utf-8") json.load(f) #load也是接收句柄,将json的字符串转换成数据结构返回 f.close() print(type(dic),dic) dump、load
2.3ensure_ascii实例
#!/usr/bin/python # -*- encodeing:utf-8 -*- import json,pickle,time,shelve # f = open("caosy","w",encoding="utf-8") # json.dump({"你所在的学习班级":"全栈"},f) # ret = json.dumps({"你所在的学习班级":"全栈"}) # f.write(ret+\'\\n\') # json.dump({"你所在的学习班级":"全栈"},f,ensure_ascii=False) # ret = json.dumps({"你所在的学习班级":"全栈"},ensure_ascii=False)# 使用此种方法在文件中写入中文时如果不添加ensure_ascii=False这个参数那么在文件中的中文显示为bytes类型,添加参数中文显示正常 # f.write(ret+\'\\n\') # f.close()
2.4json格式化输出,实例如下:
#!/usr/bin/python # -*- encodeing:utf-8 -*- import json,pickle,time,shelve # data = {\'name\':[\'张三\',\'李四\',\'王二麻子\'],\'sex\':\'male\',\'age\':16} # b = json.dumps(data,sort_keys=True,indent=5,separators=(\',\',\':\'),ensure_ascii=False) # print(b) # sort_keys=True 将数据根据keys的值进行排序 # indent = 4 空出四格 # separators 分隔符
3、pickle与json的功能一直都是使用 dumps dump load loads,唯独不同之处在于:
json,用于字符串 和 python数据类型间进行转换
pickle,用于python特有的类型 和 python的数据类型间进行转换
实例如下:
#!/usr/bin/python # -*- encodeing:utf-8 -*- import json,pickle,time,shelve dic = {\'k1\':\'v1\',\'k2\':\'v2\',\'k3\':\'v3\'} a = pickle.dumps(dic) print(a) b = pickle.loads(a) print(b) a = time.localtime(1000000000) print(a) f = open(\'abc\',\'wb\') pickle.dump(a,f) f.close() f = open(\'abc\',\'rb\') b = pickle.load(f) print(b.tm_year)
4、shelve shelvp只提供一种open的方法,实例如下:
#!/usr/bin/python # -*- encodeing:utf-8 -*- import json,pickle,time,shelve f = shelve.open(\'caoqu\') f[\'key\'] = {\'int\':10,\'float\':9.3} f.close() f1 = shelve.open("caoqu") ret = f1[\'key\'] f1.close() print(ret)
以上是关于Python模块的主要内容,如果未能解决你的问题,请参考以下文章
Python练习册 第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-),(http://tieba.baidu.com/p/2166231880)(代码片段