python进程相关 - 多线程threading库
Posted yc紫日
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python进程相关 - 多线程threading库相关的知识,希望对你有一定的参考价值。
概念
多线程类似于同时执行多个不同程序,
优点
使用线程可以把占据长时间的程序中的任务放到后台去处理。
用户界面可以更加吸引人,这样比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度
程序的运行速度可能加快
在一些等待的任务实现上如用户输入、文件读写和网络收发数据等,线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存占用等等。
基础知识
线程在执行过程中与进程还是有区别的。每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行,必须依存在应用程序(进程)中,由应用程序提供多个线程执行控制。
每个线程都有他自己的一组CPU寄存器,称为线程的上下文,该上下文反映了线程上次运行该线程的CPU寄存器的状态。
指令指针和堆栈指针寄存器是线程上下文中两个最重要的寄存器,线程总是在进程得到上下文中运行的,这些地址都用于标志拥有线程的进程地址空间中的内存。
线程可以被抢占(中断)。
在其他线程正在运行时,线程可以暂时搁置(也称为睡眠) -- 这就是线程的退让。
线程可以分为
内核线程:由操作系统内核创建和撤销。
用户线程:不需要内核支持而在用户程序中实现的线程。
python3中的多线程模块
_thread (为了兼容python2)
threading(推荐使用)
python的多线程使用
参考链接
http://www.cnblogs.com/vamei/archive/2012/10/11/2720042.html
Python中使用线程有两种方式:函数或者用类来包装线程对象。
函数式
_thread模块(一般不用)
start_new_thread()函数来产生新线程
threading模块
start_new_thread()函数来产生新线程
currentThread(): 返回当前的线程变量。
enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。
activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果。
threading.Thread类封装线程
使用方法
一般为自定义一个类,继承自threading.Thread类,这样,我们只需实现该类的方法即可。
threading.Thread类中的方法
run(): 用以表示线程活动的方法。
start():启动线程活动。
join([time]): 当前线程等待Thread对象对应的线程中止。
如thread_a.join()表示将阻塞当前线程直至thread_a线程被调用中止/正常退出/抛出异常/超时。
isAlive(): 返回线程是否活动的。
getName(): 返回线程名。
setName(): 设置线程名。
exit():线程的结束一般依靠线程函数的自然结束;也可以在线程函数中调用thread.exit(),他抛出SystemExit exception,达到退出线程的目的。
threading库中的线程同步
参考链接
http://www.cnblogs.com/vamei/archive/2012/10/11/2720042.html
要注意的问题
如果要使用的共享资源是不可变数据类型,则必须加global,将其变为全局变量;如果是可变数据类型,则不用,该数据类型的存储位于堆中
互斥锁threading.Lock对象
获得互斥锁:lock = threading.Lock()
申请互斥锁:lock.acquire()
解除互斥锁:lock.release()
条件变量threading.Condition对象
建立该对象时,会包含创建一个Lock对象
创建条件变量对象:conf = threading.Condition()
申请互斥锁:conf.acquire()
解除互斥锁:conf.release()
多个线程等待:conf.wait()
通知所有等待的线程开始工作:conf.notify_all()
通知指定的线程开始工作:conf.notify()
线程计数锁threading.Semaphore对象
也有申请互斥锁和解除互斥锁的两个方法
线程事件threading.Event对象
类似于无Lock保护的threading.Condition对象
evnetn对象有True和False两种状态,wait()会置为false,该进程等待,set()会置为True,从而所有等待状态的进程开始工作。
创建线程事件对象:event = threading.Event()
多个线程等待:event.wait()
通知所有等待的线程开始工作:event.set()
通知所有event类型的线程等待:event.clear()
适用情景暂时不明确
线程队列Queue
参考链接
http://www.runoob.com/python3/python3-multithreading.html
内容
主要包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列 PriorityQueue。
这些队列都实现了锁原语,能够在多线程中直接使用,可以使用队列来实现线程间的同步。
Queue 模块中的常用方法
Queue.qsize() 返回队列的大小
Queue.empty() 如果队列为空,返回True,反之False
Queue.full() 如果队列满了,返回True,反之False
Queue.full 与 maxsize 大小对应
Queue.get([block[, timeout]])获取队列,timeout等待时间
Queue.get_nowait() 相当Queue.get(False)
Queue.put(item) 写入队列,timeout等待时间
Queue.put_nowait(item) 相当Queue.put(item, False)
Queue.task_done() 在完成一项工作之后,Queue.task_done()函数向任务已经完成的队列发送一个信号
Queue.join() 实际上意味着等到队列为空,再执行别的操作
以上是关于python进程相关 - 多线程threading库的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫编程思想(137):多线程和多进程爬虫--Thread类与线程对象
Python爬虫编程思想(137):多线程和多进程爬虫--Thread类与线程对象