Python之路(第四十二篇)线程相关的其他方法join()Thread类的start()和run()方法的区别守护线程
Posted nicholas0707
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python之路(第四十二篇)线程相关的其他方法join()Thread类的start()和run()方法的区别守护线程相关的知识,希望对你有一定的参考价值。
Thread实例对象的方法 # isAlive(): 返回线程是否活动的。 # getName(): 返回线程名。 # setName(): 设置线程名。 ? threading模块提供的一些方法: # threading.currentThread(): 返回当前的线程对象。 # threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。 # threading.activeCount(): 返回正在运行的线程个数,与len(threading.enumerate())有相同的结果。 #threading.main_thread() 返回主线程对象 #threading.get_ident() 返回当前线程的ID,非0整数
例子
?
import time import threading ? def func(arg): time.sleep(1) print(arg,threading.current_thread(),threading.get_ident()) #threading.current_thread() 获取当前进程对象, # threading.get_ident()获取当前线程号 ? for i in range(10): threading.Thread(target=func,args=(i,)).start() print("线程数量统计",threading.active_count()) #统计当前线程数量 threading.current_thread().setName("主线程") #设置线程名字 print(threading.current_thread().isAlive()) #线程是不是活动的 print("当前线程",threading.current_thread()) print("获取当前线程名字",threading.current_thread().getName()) print("线程变量列表",threading.enumerate()) #以列表的形式显示当前所有的线程变量
二、线程的join()
与进程的join方法作用类似,线程的 join方法的作用是阻塞,等待子线程结束,join方法有一个参数是timeout,即如果主线程等待timeout,子线程还没有结束,则主线程强制结束子线程。
但是python 默认参数创建线程后,不管主线程是否执行完毕,都会等待子线程执行完毕才一起退出,有无join结果一样。进程没有join()则在执行主进程完后直接退出,而主线程是等待子线程执行完毕才一起退出。
import threading import time ? def func(n): time.sleep(2) print("线程是%s"%n) global g g = 0 print(g) ? if __name__ == ‘__main__‘: g = 100 t_l = [] for i in range(5): t = threading.Thread(target=func,args=(i,)) t.start() t_l.append(t) print("线程数量统计1--", threading.active_count()) # 统计当前线程数量,结果是6,5个子线程加1个主线程 ? for t in t_l: t.join() ? print(‘结束了‘) print("线程数量统计2--", threading.active_count()) # 统计当前线程数量,结果是1,只有一个主线程
三、Thread类的start()和run()方法的区别
start()
import threading import time ? ? def add(x, y): for _ in range(5): # _解压序列赋值,_代表不用关心的元素 time.sleep(0.5) print("x+y={}".format(x + y)) ? ? class MyThread(threading.Thread): def start(self): print(‘start-----‘) super().start() # 调用父类的start()和run()方法 ? def run(self): print(‘run-----‘) super().run() # 调用父类的start()和run()方法 ? ? t = MyThread(target=add, name="MyThread", args=(1, 2)) t.start() # t.run() print("====end===")
执行结果:
start----- run----- ====end=== x+y=3 x+y=3 x+y=3 x+y=3 x+y=3
分析:可以看出start()方法会先运行start()方法,再运行run()方法。
从源码简单追踪下start()的调用过程:
1、 def start(self): print(‘start-----‘) super().start() # 调用父类的start()和run()方法 ? ? 2、def start(self): #父类的start() _start_new_thread(self._bootstrap, ()) #执行_start_new_thread找到_start_new_thread,再次找到_thread.start_new_thread,这里是pass #下一步获取self._bootstrap值找到def _bootstrap,通过self._bootstrap_inner(),最后执行了 #self.run() .... 3、_start_new_thread = _thread.start_new_thread 4、def start_new_thread(function, args, kwargs=None): pass 5、def _bootstrap(self): self._bootstrap_inner() 6、def _bootstrap_inner(self): .... try: self.run()#最终start()方法调用了run()方法 except SystemExit: pass
run()
import threading import time ? ? def add(x, y): for _ in range(5): # _解压序列赋值,_代表不用关心的元素 time.sleep(0.5) print("x+y={}".format(x + y)) ? ? class MyThread(threading.Thread): def start(self): print(‘start-----‘) super().start() # 调用父类的start()和run()方法 ? def run(self): print(‘run-----‘) super().run() # 调用父类的start()和run()方法 ? ? t = MyThread(target=add, name="MyThread", args=(1, 2)) # t.start() t.run() print("====end===")
执行结果:
run----- x+y=3 x+y=3 x+y=3 x+y=3 x+y=3 ====end===
分析:运行线程的run()方法只能调用到run()方法。
从源码简单追踪下runt()的调用过程:
1、def run(self): print(‘run-----‘) super().run() # 调用父类的start()和run()方法 ? 2、def __init__(self, group=None, target=None, name=None, args=(), kwargs=None, *, daemon=None): self._target = target #这里的_target是个子线程的函数名 self._args = args self._kwargs = kwargs .... 3、def run(self): if self._target: self._target(*self._args, **self._kwargs) #这里就直接执行了这个函数
分析:target是我们传入的目标函数,run()方法其实就类似一个装饰器,最终还是将args 和kwargs 参数传入目标函数运行,返回结果。
继续分析:
start()
import threading import time ? ? def func(n): time.sleep(2) print("线程是%s" % n) print(‘子线程的ID号A‘, threading.current_thread().ident) global g g = 0 print(‘子线程中的g‘, g) ? ? class Mythread(threading.Thread): ? def __init__(self, arg, *args, **kwargs): super().__init__(*args, **kwargs) self.arg = arg ? def start(self): print(‘start-----‘) super().start() # 调用父类的start()和run()方法 ? def run(self): print(‘run-----‘) print("类中的子线程", self.arg) super().run() print(‘子线程的ID号B‘,threading.current_thread().ident) ? ? if __name__ == ‘__main__‘: g = 100 t1 = Mythread(‘hello‘, target=func, name="MyThread", args=(‘nick‘,)) # 第一个参数是用在Mythread类中的,后面的3个参数用在创建的func子线程中,args必须是可迭代的 # 这里的func也可以直接写在Mythread中的run()里,这时这里的run()不用再继承父类的run() t1.start() #t1.run() print(‘主线程中的g‘, g) print(‘主线程的ID号---‘, threading.current_thread().ident)
执行结果
start----- run----- 类中的子线程 hello 线程是nick 子线程的ID号A 19672 子线程中的g 0 子线程的ID号B 19672 主线程中的g 0 主线程的ID号--- 12056
分析:可以看到这里有主进程有子线程func()和mythread.run()属于同一子线程,因为mythread.run()继承父类的run()最终还是要执行func()函数的,这里只是在对象中多写了几行。
run()
import threading import time ? ? def func(n): time.sleep(2) print("线程是%s" % n) print(‘子线程的ID号A‘, threading.current_thread().ident) global g g = 0 print(‘子线程中的g‘, g) ? ? class Mythread(threading.Thread): ? def __init__(self, arg, *args, **kwargs): super().__init__(*args, **kwargs) self.arg = arg ? def start(self): print(‘start-----‘) super().start() # 调用父类的start()和run()方法 ? def run(self): print(‘run-----‘) print("类中的子线程", self.arg) super().run() print(‘子线程的ID号B‘,threading.current_thread().ident) ? ? if __name__ == ‘__main__‘: g = 100 t1 = Mythread(‘hello‘, target=func, name="MyThread", args=(‘nick‘,)) # 第一个参数是用在Mythread类中的,后面的3个参数用在创建的func子线程中,args必须是可迭代的 # 这里的func也可以直接写在Mythread中的run()里,这时这里的run()不用再继承父类的run() # t1.start() t1.run() print(‘主线程中的g‘, g) print(‘主线程的ID号---‘, threading.current_thread().ident)
执行结果
run----- 类中的子线程 hello 线程是nick 子线程的ID号A 18332 子线程中的g 0 子线程的ID号B 18332 主线程中的g 0 主线程的ID号--- 18332
分析:这可以看到,程序竟然只有有个线程,那就是主线程。
例子
import threading # 定义准备作为子线程action函数 def action(max): for i in range(max): # 直接调用run()方法时,Thread的name属性返回的是该对象的名字 # 而不是当前线程的名字 # 使用threading.current_thread().name总是获取当前线程的名字 print(threading.current_thread().name + " " + str(i)) # ① for i in range(100): # 调用Thread的currentThread()方法获取当前线程 print(threading.current_thread().name + " " + str(i)) if i == 20: # 直接调用线程对象的run()方法 # 系统会把线程对象当成普通对象,把run()方法当成普通方法 # 所以下面两行代码并不会启动两个线程,而是依次执行两个run()方法 threading.Thread(target=action,args=(100,)).run() threading.Thread(target=action,args=(100,)).run()
上面程序在创建线程对象后,直接调用了线程对象的 run() 方法,程序运行的结果是整个程序只有一个主线程。还有一点需要指出,如果直接调用线程对象的 run() 方法,则在 run() 方法中不能直接通过 name 属性(getName() 方法)来获取当前执行线程的名字,而是需要使用 threading.current_thread() 函数先获取当前线程,然后再调用线程对象的 name 属性来获取线程的名字。
通过上面程序不难看出,启动线程的正确方法是调用 Thread 对象的 start() 方法,而不是直接调用 run() 方法,否则就变成单线程程序了。
需要指出的是,在调用线程对象的 run() 方法之后,该线程己经不再处于新建状态,不要再次调用线程对象的 start() 方法。
注意,只能对处于新建状态的线程调用 start() 方法。也就是说,如果程序对同一个线程重复调用 start() 方法,将引发 RuntimeError 异常。
总结:
从上面四个小例子,我们可以总结出:
-
start() 方法是启动一个子线程
-
run() 方法并不启动一个新线程,就是在主线程中调用了一个普通函数而已。
因此,如果你想启动多线程,就必须使用start()方法。
四、守护线程
? 守护线程会在"该进程内所有非守护线程全部都运行完毕后,守护线程才会挂掉"。并不是主线程运行完毕后守护线程挂掉。这一点是和守护进程的区别之处!
需要强调的是:运行完毕并非终止运行**。
无论是进程还是线程,都遵循:守护xxx会等待xxx运行完毕后被销毁
进程与线程的守护进(线)程对比
-
对主进程来说,运行完毕指的是主进程代码运行完毕
-
对主线程来说,运行完毕指的是主线程所在的进程内所有非守护线程统统运行完毕,主线程才算运行完毕
守护进程:主进程代码运行完毕,守护进程也就结束 (守护的是主进程)
主进程要等非守护进程都运行完毕后再回收子进程的资源(否则会产生僵尸进程)才结束
主进程等子进程是因为主进程要给子进程收尸(代用wait方法向操作系统发起回收资源信号(pid号,状态信息))
守护线程:非守护线程代码运行完毕,守护线程也就结束 (守护的是非守护线程)
主线程在其他非守护线程运行完毕后才算结束(主线程的结束意味着进程的结束,守护线程在此时就会被回收)
强调:主线程也是非守护线程(进程包含了线程)
总结:
-
主线程活着的时候,守护线程才会存活。主线程结束后,守护线程会自动被杀死结束运行。
-
主线程需等所有非守护线程退出后才会退出,如果想要结束非守护线程,我们必须手动找出非守护线程将其杀死。
实例
主线程启动两个子线程:
-
子线程0-守护线程,运行10秒退出
-
子线程1-非守护线程,运行1秒退出。
根据我们上面的总结,我们会知道:
-
主线程启动完子线程,等待所有非守护线程运行
-
非守护子线程1运行1秒退出
-
此时没有非守护线程运行,主线程退出
-
子线程0虽然任务还未完成,但是它是守护线程,会紧跟主线程退出。
例子
# 守护线程 from threading import Thread import time ? def func1(): while True: print("in func1") time.sleep(5) ? def func2(): print("in func2") time.sleep(1) ? t1 = Thread(target=func1,) t1.daemon = True t1.start() t2 = Thread(target=func2,) t2.start() print("主进程")
分析:这里的t1线程作为守护线程一定是执行不完的,因为其他非守护线程很快执行完了,主线程就要结束了,主线程结束进程要回收资源,所以t1作为守护线程马上会被结束掉。
例子2
? from threading import Thread import time def foo(): print(123) time.sleep(1) print("end123") ? def bar(): print(456) time.sleep(3) print("end456") t1=Thread(target=foo) t2=Thread(target=bar) ? t1.daemon=True t1.start() t2.start() print("主线程-------")
分析:虽然这里设置了t1是守护线程,但是由于t1线程运行的时间较短,所以这里的守护线程会完成运行,不会出现运行一半程序直接退出的情况。
以上是关于Python之路(第四十二篇)线程相关的其他方法join()Thread类的start()和run()方法的区别守护线程的主要内容,如果未能解决你的问题,请参考以下文章