Python常用模块之 threading和Thread模块第二阶段线程通信及队列基操

Posted 2022-06-06 孤寒者

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python常用模块之 threading和Thread模块第二阶段线程通信及队列基操相关的知识，希望对你有一定的参考价值。

每篇前言：

🏆🏆作者介绍：【孤寒者】—CSDN全栈领域优质创作者、HDZ核心组成员、华为云享专家Python全栈领域博主、CSDN原力计划作者

🔥🔥本文已收录于Python全栈系列专栏：《Python全栈基础教程》
🔥🔥热门专栏推荐：《Django框架从入门到实战》、《爬虫从入门到精通系列教程》、《爬虫高级》、《前端系列教程》、《tornado一条龙+一个完整版项目》。
📝📝本专栏面向广大程序猿，为的是大家都做到Python从入门到精通，同时穿插有很多很多习题，巩固学习。
🎉🎉订阅专栏后可私聊进一千多人Python全栈交流群（手把手教学，问题解答）； 进群可领取Python全栈教程视频 + 多得数不过来的计算机书籍：基础、Web、爬虫、数据分析、可视化、机器学习、深度学习、人工智能、算法、面试题等。
🚀🚀加入我一起学习进步，一个人可以走的很快，一群人才能走的更远！

1. 线程通信

1.1 互斥锁：

在多线程中 , 所有变量对于所有线程都是共享的 , 因此 , 线程之间共享数据最大的危险在于多个线程同时修改一个变量 , 那就乱套了 , 所以我们需要互斥锁 , 来锁住数据。

1.2 线程间全局变量的共享：

注意：

因为线程属于同一个进程，因此它们之间共享内存区域。因此全局变量是公共的。

# -*- coding: utf-8 -*-
"""
__author__ = 孤寒者
"""
import threading

a = 1

def func():
    global  a
    a = 2

t = threading.Thread(target=func)
t.start()
t.join()

print(a)

1.3 共享内存间存在竞争问题：

先来个正常的例子，不用多线程：

# -*- coding: utf-8 -*-
"""
__author__ = 孤寒者
"""
x = 0
n =1000000
def a(n):
    global x
    for i in range(n):
        x += 1

def b(n):
    global x
    for i in range(n):
        x -= 1

a(n)
b(n)
print(x)

输出肯定和大家想的一样，毫无疑问是0！

# -*- coding: utf-8 -*-
"""
__author__ = 孤寒者
"""
from threading import Thread

x = 0
n =1000000
def a(n):
    global x
    for i in range(n):
        x += 1

def b(n):
    global x
    for i in range(n):
        x -= 1

if __name__ == '__main__':
    a = Thread(target=a,args = (n,))
    b = Thread(target=b,args = (n,))
    a.start()
    b.start()
    # 一定要加阻塞，原因大家可以自己结合第一篇讲的自己好好想想哦~
    a.join()
    b.join()
    print(x)

提示：

如果1000000不能出现效果可以继续在后面加0
你会发现这个结果千奇百怪！！！

1.4 使用锁来控制共享资源的访问：

下面引入互斥锁

在多线程中 , 所有变量对于所有线程都是共享的 ,因此 ,线程之间共享数据最大的危险在于多个线程同时修改一个变量 , 那就乱套了 , 所以我们需要互斥锁 , 来锁住数据。
只要我们操作全局变量的时候，就在操作之前加锁，在操作完之后解锁，就解决了这个资源竞争的问题！！！

第一种实现：

# -*- coding: utf-8 -*-
"""
__author__ = 孤寒者
"""
from threading import Thread, Lock

a = 0
n = 100000   # 指定加减次数
# 线程锁
lock = Lock()

def incr(n):
    global  a
    # 对全局变量a做n次加1
    for i in range(n):
        lock.acquire()
        a += 1
        lock.release()

def decr(n):
    global a
    # 对全局变量a做n次减一
    for i in range(n):
        lock.acquire()
        a -= 1
        lock.release()

t_incr = Thread(target=incr, args=(n, ))
t_decr = Thread(target=decr, args=(n, ))
t_incr.start(); t_decr.start()
t_incr.join();  t_decr.join()
print(a)

第二种实现：

# -*- coding: utf-8 -*-
"""
__author__ = 孤寒者
"""
from threading import Thread, Lock

a = 0
n = 100000   # 指定加减次数
# 线程锁
lock = Lock()

def incr(n):
    global  a
    # 对全局变量a做n次加1
    for i in range(n):
        with lock:
            a += 1

def decr(n):
    global a
    # 对全局变量a做n次减一
    for i in range(n):
        with lock:
            a -= 1

t_incr = Thread(target=incr, args=(n, ))
t_decr = Thread(target=decr, args=(n, ))
t_incr.start(); t_decr.start()
t_incr.join();  t_decr.join()
print(a)

分析此阶段，我们会发现进程和线程的痛点！！！

下述参考本篇文章：《什么是协程》

线程之间如何进行协作？
最典型的例子就是生产者/消费者模式：若干个生产者线程向队列中写入数据，若干个消费者线程从队列中消费数据。
（功能！）
1.定义了一个生产者类，一个消费者类。
2.生产者类循环100次，向同步队列当中插入数据。
3.消费者循环监听同步队列，当队列有数据时拉取数据。
4.如果队列满了（达到5个元素），生产者阻塞。
5.如果队列空了，消费者阻塞。

上面的代码正确地实现了生产者/消费者模式，但是却并不是一个高性能的实现。为什么性能不高呢？原因如下：
	1.涉及到同步锁。
	2.涉及到线程阻塞状态和可运行状态之间的切换。
	3.涉及到线程上下文的切换。
	以上涉及到的任何一点，都是非常耗费性能的操作。
	
这里就引入了协程！是一种比线程更加轻量级的存在。正如一个进程可以拥有多个线程一样，一个线程也可以拥有多个协程。
最重要的是，协程不是被操作系统内核所管理，而完全是由程序所控制（也就是在用户态执行）。
这样带来的好处就是性能得到了很大的提升，不会像线程切换那样消耗资源。
既然协程这么好，它到底是怎么来使用的呢？
代码走起来（依旧是生产者/消费者模式的例子！）:
def consumer():
    while True:
        # consumer协程等待接收数据
        number = yield
        print('开始消费', number)

consumer_result = consumer()
# 让初始化状态的consumer协程先执行起来，在yield处停止
next(consumer_result)

for num in range(100):
    print('开始生产', num)
    # 发送数据给consumer协程
    consumer_result.send(num)

代码中创建了一个叫做consumer_result的协程，并且在主线程中生产数据，协程中消费数据。
其中 yield 是python当中的语法。当协程执行到yield关键字时，会暂停在那一行，等到主线程调用send方法发送了数据，协程才会接到数据继续执行。
但是，yield让协程暂停，和线程的阻塞是有本质区别的。协程的暂停完全由程序控制，线程的阻塞状态是由操作系统内核来进行切换。

因此，协程的开销远远小于线程的开销!!!

执行结果：

2. 队列的基本概念

一个入口，一个出口；
先入先出（FIFO）。

import queue

队列操作一览:

入队： put(item)
出队： get()
测试空： empty()
测试满： full()
队列长度： qsize()
任务结束： task_done()
等待完成： join()

注意：

get()等待任务完成，如果不加task_done()则不表示任务完成，只要加这句才表明完成。才会结束执行。
join就是阻塞，直到这个任务完成（完成的标准就是每次取出都task_done()了）

简单使用队列的方法：

# -*- coding: utf-8 -*-
"""
__author__ = 孤寒者
"""
import queue

# 创建队列
q = queue.Queue(4)

# 入队
q.put(1)
q.put(2)
q.put(3)
print(q.full())
q.put(4)
print(q.full())

# 出队
print(q.get())
print(q.get())
print(q.empty())
print(q.get())
print(q.get())
print(q.empty())