sys&faker&jsonpath模块异常处理多线程多进程
Posted fangfangzhang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sys&faker&jsonpath模块异常处理多线程多进程相关的知识,希望对你有一定的参考价值。
1.sys模块
sys.argv 能获取运行文件时,文件名后面所传参数。结果是一个列表。
import sys print(sys.argv) #获取运行python文件的时候传入的参数,会连同文件名,和参数,返回一个列表。 #在terminal里运行,才能传参。如在当前目录下,运行 python sys模块.py arg1 if len(sys.argv)>1: if sys.argv[1]==‘--help‘: quit(‘这个python是用来测试的,运行的时候需要使用 python a.py port‘) else: port = sys.argv[1] else: port = 7878 import flask server = flask.Flask(__name__) @server.route(‘/‘) def index(): return ‘<h1>首页</h1>‘ server.run(port=port)
运行上边代码,返回:
2.faker模块
import faker f = faker.Faker(locale=‘zh_CN‘) #实例化,并指定语言为中文 print(f.name())#姓名 print(f.credit_card_number())#随机信用卡号 print(f.email())#随机信用卡号 print(f.ipv4())#随机ip地址 print(f.user_name())#随机用户名 print(f.phone_number())#随机电话 print(f.ssn())#随机身份证号
3.jsonpath模块
d={ "error_code": 0, "stu_info": [ { "id": 2059, "name": "小白", "sex": "男", "age": 28, "addr": "河南省济源市北海大道32号", "grade": "天蝎座", "phone": "18378309272", "gold": 10896, "info":{ "card":6214234235232352, "bank_name":‘中国银行‘, "name":‘zff‘ } } ], ‘name‘:‘哈哈哈‘ } #普通取name res = d[‘stu_info‘][1][‘name‘] print(res) # jsonpath取name import jsonpath res = jsonpath.jsonpath(d,‘$..name‘) #模糊匹配,不管层次与位置.$代表外部大字典,..代表任意的。。 #res2 = d[‘stu_info‘][0][‘info‘][‘bank_name‘] #res2=jsonpath.jsonpath(d,‘$.[‘stu_info‘][0][‘info‘][‘bank_name‘]‘) #这2个res2效果是一样的
4.面向对象——继承
在父类某个方法的基础上再增加新功能:
super().xxx()
super()会自动找到父类
class Car: def run(self,): print(‘running...‘) return ‘abc‘ class NewCar(Car): def run(self): res = super().run()# 保留父类run的方法,super()的意思就是找到父类 #res=Car().run() #与上边super功能一样,但父类名称改的时候,他也得改 print(‘fly...‘,res) bmw = NewCar() bmw.run()
5.异常处理
处理异常,将出错的情况进行处理,使出错时抛出提示或要求继续某种操作,而不是报错让程序进行不下去。
用 try: xxx except Exception as e: print(‘提示语‘)
try和except是必须的,else和finally选用。
try: res = 1 / 0 except ZeroDivisionError as e: #except ZeroDivisionError,e: #python2不能用as,要用, print(‘出错啦,除数不能为0‘,e) l = list() l.append(1) d = dict() # d[‘name‘]=‘abc‘ try: print(d[‘name‘]) print(l[-1]) except IndexError as e: #只能捕捉到越界下标错误 print(‘出错了,下标越界‘,e) except KeyError as e: print(‘字典key不存在‘,e) except Exception as e: #能捕捉各种异常,但不会界定是何种异常 print(‘未知异常‘,e) else: print(‘没有出现异常。。。‘) finally: #不管异常是否出现,都会执行,使用场景:打开文件或数据库,出错了,但也得关闭 print(‘什么时候执行finally‘) dic = {} print(dic[‘name‘]) class NumberError(Exception): pass class M: def main(self): count = input(‘请输入要产生多条银行卡号:‘).strip() if not count.isdigit(): raise NumberError(‘输入的数字不对‘) #主动抛出异常,判断为一个什么时候,终止运行 #raise Exception(‘自定义异常‘) m = M() m.main()
6.多线程
线程:程序执行的最小单位。
为什么有时候单线程比主线程快?
电脑CPU有几个核心,就同时只能运行几个线程。
感觉多线程运行。很快,其实并没有,只是CPU运行速度特别快,切换速度特别快
全局解释器锁,叫GIL。python加了个锁,让每个CPU只运行一个线程,避免数据错乱。
单线程:没有做多线程,就是单线程
多线程:利用for语句,启动多个线程
for i in range(20): #启动了多个线程
t1 = Thread(target=run,)
t1.start()
主线程等待子线程执行任务:t.join()
或
while threading.active_count()!=1: #判断子线程是否执行结束,这种简单
pass
#运行程序规则:首先由一个线程,会将代码从头到尾执行一遍。 import threading #该模块提供线程 from threading import Thread import time def run(): time.sleep(1) print(‘run...‘) start_time = time.time() # for i in range(5): #串行,得5s,单线程运行 run() threads = [] for i in range(20): #启动了多个线程 t1 = Thread(target=run,) t1.start() #t1.join() #这儿不能加,否则会变成串联线程,即单线程 # threads.append(t1) # for t in threads: #循环,同时等待多个线程 # t.join() #这一部分是一个等待代码 while threading.active_count()!=1: #判断子线程是否执行结束,这种比上边等待代码块简单 pass end_time = time.time() print(end_time - start_time)
7.多进程
用法上跟多线程特别相似
进程:
一些资源的集合。如qq, 图片,程序
一个进程里面最少有一个线程, 主线程。
一个进程可以包含多个线程
可以利用多个cpu的。
IO密集型任务: 即input output,分为磁盘io和网络io
IO消耗比较多的,适合多线程
CPU密集型任务:消耗CPU多的,适合多进程
为啥python的多线程利用不了多核CPU,但是咱们看起来的时候还是并发的?
因为在Python多线程下,每个线程的执行方式:
1、获取GIL
2、执行代码直到sleep或者是python虚拟机将其挂起。
3、释放GIL
可见,某个线程想要执行,必须先拿到GIL,我们可以把GIL看作是“通行证”,
并且在一个python进程中,GIL只有一个。拿不到通行证的线程,就不允许进入CPU执行。
import multiprocessing import time import threading import requests def run(): time.sleep(10) print(‘run...‘) if __name__ == ‘__main__‘: for i in range(10): p = multiprocessing.Process(target=run) p.start() while multiprocessing.active_children(): #等待其他子进程运行结束 pass
8.守护线程
守护主线程,主线程执行完成之后,子线程立即结束。如秦始皇死,相关人都得死。
import threading import time def run(): time.sleep(5) print(‘run。。。‘) for i in range(100): puren = threading.Thread(target=run) puren.setDaemon(True)#设置子线程为守护线程。如果不加,这个会运行100次run.加了后,运行一次。 puren.start() print(‘over‘) #即不加等待,主线程一运行完,子线程就停止运行。
9.锁
多个线程同时去操作同一个数据的时候,可能会导致数据不正确。
要把这个数据机上锁,这样同时就只能有一个线程在操作这个数据了。
python3会自动加锁,所有写不写加不加锁代码没所谓
import threading count = 0 lock = threading.Lock() #申请一把锁 def run(): global count with lock: count+=1 # lock.acquire()#加上锁 # count+=1 # lock.release()#释放,必须的,要么会停着不动 #这3行代码跟上边功能一样 #python里边不加锁也行,因为python3会自动加锁 for i in range(10): #多个线程都要去操作count数据 t = threading.Thread(target=run) t.start() while threading.active_count()!=1: pass print(count)
10.牛刀小试
生成尾号为11的银行卡号:
# 10 #工商银行:6222342 #广发银行:34634 #1、获取数据,把不需要的数据过滤掉 import random import string class BankCardId: file_name = ‘card_no‘ all = [] # 保存所有有效的数据 def __init__(self):#自动调用函数,取到all self.get_data() def get_data(self): #取到最后俩位数为11的数据,all取到[[‘工商银行‘, ‘18‘, ‘620200‘], [‘工商银行‘, ‘18‘, ‘620302‘],...] with open(self.file_name,encoding=‘utf-8‘) as fr: for line in fr: if line.strip():#判断不是空行 new_line = line.split()[1:] a,b = new_line[-1],new_line[-2] #获取末尾2个元素 if a==b==‘1‘:#判断末尾2个元素是不是都是1 self.all.append(new_line[:3]) def get_card(self): #生成银行卡号 bank_name,lenth,start = random.choice(self.all) other_lenth = int(lenth) - len(start) - 2 other = ‘‘.join( random.choice(string.digits) for i in range(other_lenth) ) res = start + other + ‘11‘ print(bank_name,self.my_print(res)) def my_print(self,s): count = 0 new_s = ‘‘ for i in s: count += 1 new_s += i if count == 4: new_s += ‘ ‘ count = 0 return new_s def main(self): num = input(‘请输入要产生多少条:‘).strip() for i in range(int(num)): self.get_card() b = BankCardId() # b.get_data() # print(b.all) b.main()
下载网页图片:
import threading import requests import random import time from hashlib import md5 res = [] def down_load_pic(url): #下载图片的url r = requests.get(url) file_name = md5(r.content).hexdigest()#把文件md5之后字符串当做文件名 with open(file_name+‘.jpg‘,‘wb‘) as fw: fw.write(r.content) print(‘%s下载完成‘%file_name) res.append(file_name) urls = [ ‘http://www.nnzhp.cn/wp-content/uploads/2018/12/110405th7jtus7gjjlywnl.jpg‘, ‘http://www.nnzhp.cn/wp-content/themes/QQ/images/thumbnail.png‘, ‘http://www.nnzhp.cn/wp-content/uploads/2018/08/f38a12137574f4333f7686f7e75a06fb8bd9fed537ea59-pRwNuK_fw658.jpeg‘, ‘http://www.nnzhp.cn/wp-content/uploads/2018/08/c1bba9a47cfe8fe7000f137f020ad623.png‘, ] start_time = time.time() #单线程 # for url in urls: # down_load_pic(url) #多线程 for url in urls: t = threading.Thread(target=down_load_pic,args=(url,) ) t.start() while threading.active_count()!=1:#等待子线程运行完成 pass print(res) end_time = time.time() print(‘下载完成,下载时间是 %s‘% (end_time-start_time)) # 下载完成,下载时间是 107.56531095504761,单线程 # 下载完成,下载时间是 81.53419184684753 多线程
以上是关于sys&faker&jsonpath模块异常处理多线程多进程的主要内容,如果未能解决你的问题,请参考以下文章
常用模块---sys&logging&序列化模块(json&pickle)