Python爬虫基础讲解(十八):线程池的使用
Posted 松鼠爱吃饼干
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫基础讲解(十八):线程池的使用相关的知识,希望对你有一定的参考价值。
Python爬虫、数据分析、网站开发等案例教程视频免费在线观看
https://space.bilibili.com/523606542
Python学习交流群:1039649593
线程池的使用
ThreadPoolExecutor
有一种比你上面看到的更简单的方法来启动一组线程。它被称为a ThreadPoolExecutor,它是标准库的一部分concurrent.futures(从Python 3.2开始)。
创建它的最简单方法是作为上下文管理器,使用该with语句来管理池的创建和销毁。
import concurrent.futures import time def thread_function(name) : print("子线程%s:启动”% name) time.s1eep(2) print("子线程%s:完成”% name) if __name__ == "_main__": with concurrent.futures.ThreadPoo1Executor(max_workers=3) as executor": for i in range(10): executor.submit(thread_function,i)
代码创建一个ThreadPoo1Executor 上下文管理器,告诉它在池中需要多少个工作线程。然后,它.map()会逐步执行可迭代的事物,在您的情况下range(3),将每个事物传递给池中的线程。
with块的结尾导致在池中的每个线程上ThreadPoo7Executor执行a .join())。这是强烈建议您使用ThreadPoo1Executor的上下文管理器时,你可以让你永远不会忘记.join()的线程。
示例代码将生成如下所示的输出:
子线程0:启动
子线程1:启动
子线程2:启动
子线程2:完成
子线程0:完成
子线程1:完成
多线程的优缺点
优点:
- 多线程技术使程序的响应速度更快,让程序高效率的执行
- 提升了计算能力
缺点:
- 多线程是没有绝对执行顺序的(理解)
- 等候使用共享资源时造成程序的运行速度变慢。这些共享资源主要是独占性的资源,如如全局变量。
- 对线程进行管理要求额外的CPU开销。线程的使用会给系统带来上下文切换的额外负担。当这种负担超过一定程度时,多线程的特点主要表现在其缺点上,比如用独立的线程来更新数组内每个元素。
- 线程的死锁。即较长时间的等待或资源竞争以及死锁等多线程症状。
以上是关于Python爬虫基础讲解(十八):线程池的使用的主要内容,如果未能解决你的问题,请参考以下文章