Python爬虫基础讲解(十八):线程池的使用

Posted 松鼠爱吃饼干

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫基础讲解(十八):线程池的使用相关的知识,希望对你有一定的参考价值。

Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

https://space.bilibili.com/523606542 

 

Python学习交流群:1039649593

 

线程池的使用

ThreadPoolExecutor

有一种比你上面看到的更简单的方法来启动一组线程。它被称为a ThreadPoolExecutor,它是标准库的一部分concurrent.futures(从Python 3.2开始)。

创建它的最简单方法是作为上下文管理器,使用该with语句来管理池的创建和销毁。

import concurrent.futures
import time

def thread_function(name) :
    print("子线程%s:启动”% name)
    time.s1eep(2)
    print("子线程%s:完成”% name)
if __name__ == "_main__":
    with concurrent.futures.ThreadPoo1Executor(max_workers=3) as executor":
    for i in range(10):
        executor.submit(thread_function,i)

 

代码创建一个ThreadPoo1Executor 上下文管理器,告诉它在池中需要多少个工作线程。然后,它.map()会逐步执行可迭代的事物,在您的情况下range(3),将每个事物传递给池中的线程。

with块的结尾导致在池中的每个线程上ThreadPoo7Executor执行a .join())。这是强烈建议您使用ThreadPoo1Executor的上下文管理器时,你可以让你永远不会忘记.join()的线程。

示例代码将生成如下所示的输出:

子线程0:启动
子线程1:启动
子线程2:启动
子线程2:完成
子线程0:完成
子线程1:完成

 

多线程的优缺点

优点:

  • 多线程技术使程序的响应速度更快,让程序高效率的执行
  • 提升了计算能力

缺点:

  • 多线程是没有绝对执行顺序的(理解)
  • 等候使用共享资源时造成程序的运行速度变慢。这些共享资源主要是独占性的资源,如如全局变量。
  • 对线程进行管理要求额外的CPU开销。线程的使用会给系统带来上下文切换的额外负担。当这种负担超过一定程度时,多线程的特点主要表现在其缺点上,比如用独立的线程来更新数组内每个元素。
  • 线程的死锁。即较长时间的等待或资源竞争以及死锁等多线程症状。

以上是关于Python爬虫基础讲解(十八):线程池的使用的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫(十八)_多线程糗事百科案例

Python爬虫(十八)_多线程糗事百科案例

Python爬虫基础讲解(十七):threading模块的使用

python 线程池的使用

线程基础:线程池——基本使用(上)

线程基础:线程池——基本使用(上)