常用模块(Day25-Day28)
Posted 郭圆
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了常用模块(Day25-Day28)相关的知识,希望对你有一定的参考价值。
模块分为三种:
1.内置模块:python安装时自带的。
2.扩展模块:别人写的,需要安装之后可以直接使用,如django,tornado等。
3.自定义模块:自己写的模块。
序列化模块
序列指字符串,序列化就是将字典、列表转换成字符串的过程。
1.json模块 所有编程语言通用,支持的数据类型有限,只支持数字、字符串、序列、字典,不支持除了str数据类型之外key,json中所有字符串都用双引号“”。
功能:
1)dumps和loads 在内存中操作数据,用于网络传输和多个字典。
dumps 序列化:数据转换成字符串。
loads 反序列化:字符串转回原数据类型。
import json dict = {\'name\':\'yuan\',\'age\':18} ret = json.dumps(dict) print(type(ret),ret) #<class \'str\'> {"name": "yuan", "age": 18} res = json.loads(ret) print(type(res),res) #<class \'dict\'> {\'name\': \'yuan\', \'age\': 18}
dict1 = {\'name\':\'yuan\',\'age\':18} dict2 = {\'name\':\'alex\',\'age\':20} dict3 = {\'name\':\'jin\',\'age\':25} f = open(\'log1\',\'a\',encoding=\'utf-8\') str1 = json.dumps(dict1) f.write(str1+\'\\n\') str2 = json.dumps(dict2) f.write(str2+\'\\n\') str3 = json.dumps(dict3) f.write(str3+\'\\n\') f.close() f = open(\'log1\',\'r\',encoding=\'utf-8\') for i in f: print(json.loads(i.strip())) f.close()
2)dump 和 load 在文件中操作数据,用于一个数据直接存在文件里
dump :数据写入文件。
load:文件中的字符串转换成数据读出。
dict = {\'name\':\'yuan\',\'age\':18} f = open(\'log\',\'w\',encoding=\'utf-8\') json.dump(dict,f) f.close() with open(\'log\',\'r\',encoding=\'utf-8\') as f: ret = json.load(f) print(ret)
2.pickle模块 只能在python语言的程序之间传递数据,支持python的所有数据类型,序列化结果是bytes类型。
dumps,loads,dump,load和json用法一样
可以直接写入读取多行
dict1 = {\'name\':\'yuan\',\'age\':18} dict2 = {\'name\':\'alex\',\'age\':20} dict3 = {\'name\':\'jin\',\'age\':25} f = open(\'log3\',\'wb\') pickle.dump(dict1,f) pickle.dump(dict2,f) pickle.dump(dict3,f) f.close() f = open(\'log3\',\'rb\') while True: try: print(pickle.load(f)) except EOFError: break
序列化自定义类对象
class A: def __init__(self,name,age): self.name = name self.age = age a = A(\'alex\',80) import pickle ret = pickle.dumps(a) print(ret) obj = pickle.loads(ret) print(obj.__dict__) f = open(\'log4\',\'wb\') pickle.dump(a,f) f.close() f = open(\'log4\',\'rb\') obj = pickle.load(f) print(obj.__dict__)
3.shelve模块 只支持python,针对文件操作
import shelve f = shelve.open(\'log5\') f[\'key\'] = {\'int\':10, \'float\':9.5,\'str\':\'Sample data\'} f.close() f1 = shelve.open(\'log5\') existing = f1[\'key\'] f1.close() print(existing) f2 = shelve.open(\'log5\') f2[\'key\'][\'int\'] = 50 #不能修改已有结构中的值 f2[\'key\'][\'new\'] = \'new\'# 不能在已有的结构中添加新的项 f2[\'key\'] = \'new\' #但是可以覆盖原来的结构 existing = f2[\'key\'] f2.close() print(existing)
hashlib模块
特点:
1)提供摘要算法,将字符串转换成数字,不同的字符串转换的数字一定不同。
2)一段字符串直接进行摘要和分成几段进行摘要的结果是相同的。
3)摘要过程不可逆。
用途:文件的一致性校验(md5),密文验证的时候加密(md5和sha)。
1.md5通用算法
import hashlib m = hashlib.md5() m.update(\'123456\'.encode(\'utf-8\')) print(m.hexdigest()) # 打印十六进制 m = hashlib.md5(\'wahahah\'.encode(\'utf-8\')) #加盐 m.update(\'123456\'.encode(\'utf-8\')) print(m.hexdigest()) username = \'yuan\' #动态加盐 m = hashlib.md5(username.encode(\'utf-8\')) m.update(\'123456\'.encode(\'utf-8\')) print(m.hexdigest()) #d3f17b4a0cf89aaa4ad56828e6bf9523
2.sha算法
用法和md5一样,安全系数更高,后面的数字越大安全系数越高,结果越长计算时间越长
m = hashlib.sha1() m.update(\'123456\'.encode(\'utf-8\')) print(m.hexdigest())
文件一致性校验
import hashlib #引用hashlib模块 def check(filename): #创建一个函数 md5obj = hashlib.md5() #创建一个md5算法对象 with open(filename,\'rb\') as f: #以读的形式打开文件得到一个文件句柄 while True: content = f.read(1024) #读出文件内容,可以分成几段摘要 if content: md5obj.update(content) # else: break return md5obj.hexdigest() #返回十六进制的字符串 ret1 = check(\'file1\') ret2 = check(\'file2\') print(ret1) print(ret2)
configparse模块 配置文件模块
logging模块 记录日志模块
collections模块 增加扩展数据类型
time时间模块
random模块
生成随机验证码
import random def id_code(num): ret = \'\' for i in range(num): number = str(random.randint(0,9)) alph_num1 = random.randint(65,90) alph_num2 = random.randint(97,122) alph1 = chr(alph_num1) alph2 = chr(alph_num2) choice = random.choice([number,alph1,alph2]) ret += choice return ret print(id_code(6))
sys 模块
1.sys.argv:以脚本的形式执行一个文件的时候可以加一些参数,主要用于执行脚本前的登录和指定脚本的启动模式
两个用法:
1)执行脚本前的登录
import sys print(sys.argv) #返回一个列表,列表第一项是当前文件所在的路径 if sys.argv[1] == \'alex\' and sys.argv[2] == \'1234\': #设置两个参数 print(\'登录成功\') else: sys.exit() 在以脚本的形式执行时直接输入两个参数就可以了
2)制定脚本的启动模式
import sys #引用sys模块 import logging #引用记录日志模块 inp = sys.argv[1] if len(sys.argv) > 1 else \'WARNING\' #如果sys.argv的长度大于1,inp等于sys.argv的第一项,否则inp等于warning logging.basicConfig(level=getattr(logging,inp)) #登录日志级别设置为inp num = int(input(\'>>>\')) #输入数字 logging.debug(num) #设置打印级别为debug a = num * 100 logging.debug(a) b = a - 10 logging.debug(b) c = b + 5 print(c)
2.sys.path 导入模块的时候从这个路径获取。
3.sys.exit() 退出程序。
4.sys.version 查看当前python解释器版本。
5.sys.platform 查看当前操作系统。
os模块
os模块是与操作系统交互的一个接口
\'\'\' os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd os.curdir 返回当前目录: (\'.\') os.pardir 获取当前目录的父目录字符串名:(\'..\') os.makedirs(\'dirname1/dirname2\') 可生成多层递归目录 os.removedirs(\'dirname1\') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 os.mkdir(\'dirname\') 生成单级目录;相当于shell中mkdir dirname os.rmdir(\'dirname\') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname os.listdir(\'dirname\') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.remove() 删除一个文件 os.rename("oldname","newname") 重命名文件/目录 os.stat(\'path/filename\') 获取文件/目录信息 os.sep 输出操作系统特定的路径分隔符,win下为"\\\\",Linux下为"/" os.linesep 输出当前平台使用的行终止符,win下为"\\t\\n",Linux下为"\\n" os.pathsep 输出用于分割文件路径的字符串 win下为;,Linux下为: os.name 输出字符串指示当前使用平台。win->\'nt\'; Linux->\'posix\' os.system("bash command") 运行shell命令,直接显示 os.popen("bash command).read() 运行shell命令,获取执行结果 os.environ 获取系统环境变量 os.path os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以/或\\结尾,那么就会返回空值。 即os.path.split(path)的第二个元素 os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False os.path.isabs(path) 如果path是绝对路径,返回True os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.getatime(path) 返回path所指向的文件或者目录的最后访问时间 os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间 os.path.getsize(path) 返回path的大小 \'\'\'
re模块
正则表达式
概念:正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
主要用于:表单验证—使用一些规则来检测字符串是否符合要求。
爬虫—从一段字符串中找到符合要求的内容。
字符组:在同一个位置可能出现的各种字符组成了一个字符组,用[ ]表示,一个字符组只能匹配一个字符。
字符
量词
以上是关于常用模块(Day25-Day28)的主要内容,如果未能解决你的问题,请参考以下文章