python中常用模块详解二

Posted 2020-10-28 zjcode

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python中常用模块详解二相关的知识，希望对你有一定的参考价值。

log模块的讲解

 1 Python 使用logging模块记录日志涉及四个主要类，使用官方文档中的概括最为合适：
 2 
 3 logger提供了应用程序可以直接使用的接口API；
 4 handler将(logger创建的)日志记录发送到合适的目的输出；
 5 formatter决定日志记录的最终输出格式
 6 filter提供了细度设备来决定输出哪条日志记录；
 7 
 8 logger
 9 每个程序在输出信息之前都要获得一个Logger。Logger通常对应了程序的模块名，
10 比如聊天工具的图形界面模块可以这样获得它的Logger：LOG=logging.getLogger(”chat.gui”)
11 
12 还可以绑定handler和filters
13 Logger.setLevel(lel):指定最低的日志级别，低于lel的级别将被忽略。debug是最低的内置级别，critical为最高
14 Logger.addFilter(filt)、Logger.removeFilter(filt):添加或删除指定的filter
15 Logger.addHandler(hdlr)、Logger.removeHandler(hdlr)：增加或删除指定的handler
16 每个Logger可以附加多个Handler。接下来我们就来介绍一些常用的Handler：
17 logging.StreamHandler 使用这个Handler可以向类似与sys.stdout或者sys.stderr的任何文件对象(file object)输出信息。
18 logging.FileHandler 和StreamHandler 类似，用于向一个文件输出日志信息。不过FileHandler会帮你打开这个文件
19 logging.handlers.RotatingFileHandler
20 这个Handler类似于上面的FileHandler，但是它可以管理文件大小。
21 当文件达到一定大小之后，它会自动将当前日志文件改名，然后创建 一个新的同名日志文件继续输出。
22 比如日志文件是chat.log。当chat.log达到指定的大小之后，
23 RotatingFileHandler自动把 文件改名为chat.log.1。
24 不过，如果chat.log.1已经存在，会先把chat.log.1重命名为chat.log.2。。。
25 最后重新创建 chat.log，继续输出日志信息。
26 函数格式： RotatingFileHandler( filename[, mode[, maxBytes[, backupCount]]])  maxBytes最大长度 backupCount保留的文件个数
27 logging.handlers.TimedRotatingFileHandler
28 这个Handler和RotatingFileHandler类似，不过，它没有通过判断文件大小来决定何时重新创建日志文件，
29 而是间隔一定时间就 自动创建新的日志文件。重命名的过程与RotatingFileHandler类似，
30 不过新的文件不是附加数字，而是当前时间。
31 它的函数是：TimedRotatingFileHandler( filename [,when [,interval [,backupCount]]])
32                                         when=“S” 秒计算 interveal间隔 backupCount保留的文件个数
33 S 秒   M 分   H 小时   D天   W  每星期（interval==0时代表星期一）midnight 每天凌晨
34 formatter 组件
35 日志的formatter是个独立的组件，可以跟handler组合
36 fh = logging.FileHandler("access.log")
37 formatter = logging.Formatter(‘%(asctime)s - %(name)s - %(levelname)s - %(message)s‘)
38 fh.setFormatter(formatter) #把formmater绑定到fh上
39 如果你想对日志内容进行过滤，就可自定义一个filter
40 class IgnoreBackupLogFilter(logging.Filter):
41     """忽略带db backup 的日志"""
42     def filter(self, record): #固定写法
43         return   "db backup" not in record.getMessage()
44 
45 # 注意filter函数会返加True or False，logger根据此值决定是否输出此日志
46 
47 # 然后把这个filter添加到logger中
48 # logger.addFilter(IgnoreBackupLogFilter())

说明解析

import logging
from logging import handlers

# 设置一个输出到屏幕上的handler
log_p_handler = logging.StreamHandler()
# 定义一个输入文件的handler
log_f_handler = logging.FileHandler("xx.log", encoding="utf8")
# 这个是那日志截断的例子，按照长度截断
log_f_handler_1 = handlers.RotatingFileHandler("xxx.log", maxBytes=10, backupCount=2, encoding="utf8")
log_f_handler_1.setLevel(logging.WARNING)
log_f_handler.setLevel(logging.WARNING)  # 给出入到文件的handler定义一个日志级别
log_p_handler.setLevel(logging.INFO)  # 给出入到屏幕的handler定义一个日志级别
fm_p = logging.Formatter("%(asctime)s-%(levelname)s->%(message)s", datefmt="%Y-%m-%d %I:%M:%S")  # 定义两个格式
fm_f = logging.Formatter("%(asctime)s-%(filename)s-%(levelname)s->%(message)s", datefmt="%Y-%m-%d %I:%M:%S")
# 把格式分别加到 对用的handler中
log_f_handler.setFormatter(fm_f)
log_f_handler_1.setFormatter(fm_f)
log_p_handler.setFormatter(fm_p)
log = logging.getLogger("test")  # 生成一个log接口
# 将自己定义的handler 加到log中
log.addHandler(log_p_handler)
log.addHandler(log_f_handler)
log.addHandler(log_f_handler_1)
# 设置log全局的日志级别  如果不设置  则默认WARNING级别
log.setLevel(logging.INFO)
log.info("info log")
log.warning("warn log")
log.debug("debug log")

subproess模块提供统一的模块来实现对系统命令或脚本的调用

# 三种执行命令的方法
# subprocess.run(*popenargs, input=None, timeout=None, check=False, **kwargs) #官方推荐
# subprocess.call(*popenargs, timeout=None, **kwargs) #跟上面实现的内容差不多，另一种写法
# #subprocess.Popen() #上面各种方法的底层封装
# run的标准写法
import subprocess

subprocess.run([‘df‘, ‘-h‘], stderr=subprocess.PIPE, stdout=subprocess.PIPE, check=True)
# 参数解析：[‘df‘,‘-h‘] 列表 执行命令 subprocess 会拼接起来  stdout 标准输出=PIPE管道符 check  检查TRUE则报错
# 此外还可以跟shell=TRUE  这样就可以直接写命令 ：
subprocess.run(‘df -h|grep disk1‘, shell=True)  # shell=True的意思是这条命令直接交给系统去执行，不需要python负责解析
# 执行命令，返回命令执行状态 ， 0 or 非0
retcode = subprocess.call(["ls", "-l"])
# 执行命令，如果命令结果为0，就正常返回，否则抛异常
subprocess.check_call(["ls", "-l"])
# 0
# 接收字符串格式命令，返回元组形式，第1个元素是执行状态，第2个是命令结果
subprocess.getstatusoutput(‘ls /bin/ls‘)
# (0, ‘/bin/ls‘)
# 接收字符串格式命令，并返回结果
subprocess.getoutput(‘ls /bin/ls‘)
# ‘/bin/ls‘
# 执行命令，并返回结果，注意是返回结果，不是打印，下例结果返回给res
res = subprocess.check_output([‘ls‘, ‘-l‘])
# res= b‘total 0\ndrwxr-xr-x 12 alex staff 408 Nov 2 11:05 OldBoyCRM\n‘

# Popen   不会等待命令执行返回结果 而是返回一个句柄 a调用poll()方法可以检测a的指定状态
a = subprocess.Popen(‘sleep 10‘, shell=True, stdout=subprocess.PIPE)
#这里还有其他方法  就不一一赘述了
# a.wait()  a.kill()  a.pid()
# a.send_signal()  a.terminate()

hashlib：用于加密相关的操作，代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法

import hashlib
# 用于加密相关的操作，3.x里代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法


m=hashlib.md5()
m.update(bytes("我", encoding="utf8"))
m.update(b‘it is me ‘)
print("二进制", m.digest())
print("十六进制", m.hexdigest())
#以上加密算法虽然依然非常厉害，但时候存在缺陷，即：通过撞库可以反解。所以，有必要对加密算法中添加自定义key再来做加密。
print("".center(50,"*"))
m1=hashlib.md5(bytes("生成时加密",encoding="utf8"))
m1.update(bytes("我", encoding="utf8"))
m1.update(b‘it is me ‘)
print("二进制", m.digest())
print("十六进制", m.hexdigest())

re模块：正则表达式就是字符串的匹配规则，在多数编程语言里都有相应的支持，python里对应的模块是re

‘.‘     默认匹配除\n之外的任意一个字符，若指定flag DOTALL,则匹配任意字符，包括换行
# ‘^‘     匹配字符开头，若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
# ‘$‘     匹配字符结尾， 若指定flags MULTILINE ,re.search(‘foo.$‘,‘foo1\nfoo2\n‘,re.MULTILINE).group() 会匹配到foo1
# ‘*‘     匹配*号前的字符0次或多次， re.search(‘a*‘,‘aaaabac‘)  结果‘aaaa‘
# ‘+‘     匹配前一个字符1次或多次，re.findall("ab+","ab+cd+abb+bba") 结果[‘ab‘, ‘abb‘]
# ‘?‘     匹配前一个字符1次或0次 ,re.search(‘b?‘,‘alex‘).group() 匹配b 0次
# ‘{m}‘   匹配前一个字符m次 ,re.search(‘b{3}‘,‘alexbbbs‘).group()  匹配到‘bbb‘
# ‘{n,m}‘ 匹配前一个字符n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 结果‘abb‘, ‘ab‘, ‘abb‘]
# ‘|‘     匹配|左或|右的字符，re.search("abc|ABC","ABCBabcCD").group() 结果‘ABC‘
# ‘(...)‘ 分组匹配， re.search("(abc){2}a(123|45)", "abcabca456c").group() 结果为‘abcabca45‘
# 
# 
# ‘\A‘    只从字符开头匹配，re.search("\Aabc","alexabc") 是匹配不到的，相当于re.match(‘abc‘,"alexabc") 或^
# ‘\Z‘    匹配字符结尾，同$ 
# ‘\d‘    匹配数字0-9
# ‘\D‘    匹配非数字
# ‘\w‘    匹配[A-Za-z0-9]
# ‘\W‘    匹配非[A-Za-z0-9]
# ‘s‘     匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 ‘\t‘
# 
# ‘(?P<name>...)‘ 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city")
#  结果{‘province‘: ‘3714‘, ‘city‘: ‘81‘, ‘birthday‘: ‘1993‘}

模式详解

import re

s = ‘ab23cd121rf‘

res=re.match("[0-9]",s) #从头开始匹配  匹配一个就结束
print(res)
res = re.search("[0-9]{2}", s)  # 从全部的字符匹配  匹配一个就结束
print(res)  # 对象 取里面的值则为group  没有则报错，那结果之前需要判断
if res:
    print(res.group())
else:
    print("none!")
print(re.findall("[0-9]", s))  # 匹配所有 符合 就 把它放在列表
print(re.search(".", "aaa"))  # 从开头一直找 找到 任意字符返回
print(re.search("^a", "aaa"))  # 相当于match(‘a‘)
print(re.search("^ab", "abaab"))  # 相当于match(‘a‘)
print(re.search("ab+$", "abaabb"))  # 从最后开始找。以abb(多个b)结尾的
print(re.search("[a|A]lex","alexAlex"))   #自己的理解就是拿着alex
 #或 Alex在字符里面找  找到一个满足就可以
print(re.search("[a|A]lex","aaAlex"))
s = ‘120980199612098769‘
#必须是字符匹配
print(re.search("(\d{6})(\d{4})(\d{4})",s).groups())
#分组匹配的装逼
print(re.search("(?P<province>\d{6})(?P<year>\d{4})(?P<mothon>\d{4})", s).groupdict())
f = open("联系方式.txt", encoding="gbk")
data = f.read()
print(data)
f.close()

res = re.findall("(1\d{10})", data)  # 手机号码
print(res)
s = "alex22jack22rain33"
print(re.split("\d", s))  # 按照一种格式分割
print(re.split("\d+", s))
s1 = "alex22jack22rain33#mock-oldboy"
print(re.split("\d+|#|-", s1))

# 所给字符全部匹配成功则返回字符否则为0
# print(re.fullmatch(‘\[email protected]\w+\.(com|cn|edu)‘,"[email protected]"))
# 模糊找到需要匹配的字符替换
print(re.sub("[\d+|#|-]", "_", s1))

s = ‘9-2*5/3+7/3*99/4*2998+10*568/14‘
# print(re.split(‘[\*\-/+]‘,s))   #转义需要\ 来表达
print(re.split(‘[\*\-/+]‘, s, maxsplit=2))  # 转义需要\ 来表达 maxsplit 匹配前几个之后停止匹配
# [‘9‘, ‘2‘, ‘5‘, ‘3‘, ‘7‘, ‘3‘, ‘99‘, ‘4‘, ‘2998‘, ‘10‘, ‘568‘, ‘14‘]

以上是关于python中常用模块详解二的主要内容，如果未能解决你的问题，请参考以下文章

python3 常用模块详解

python中常用模块详解二

常用模块学习random模块详解

为什么二代测序的原始数据中会出现Read重复现象？

详解Python基础操作之os模块常用命令

python中math模块的常用详解