爬虫.多线程爬虫与多进程爬虫

Posted jacky912

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫.多线程爬虫与多进程爬虫相关的知识,希望对你有一定的参考价值。

多线程爬虫

  多线程的复杂性

   1.资源、数据的安全性:锁保护

   2.原子性:数据操作是天然互斥的

   3.同步等待:wait()、notify()、notifyAll()

   4.死锁:多个线程对资源互锁,造成死锁

   5.容灾:任何线程出现错误,整个进程都会停止

  多线程的优势

   1.内存空间共享,信息数据交换效率高

   2.提高CPU的使用效率

   3.开发便捷

   4.轻,创建、销毁的开销小

  Python线程

    支持多线程(javascript php 不支持多线程)

    Python线程直接映射到native线程(Java1.4的Java线程是JVM实现的,共同运行在一个native thread)

    GIL:对于多核的利用能力有限

  实现一个多线程爬虫

 

以上是关于爬虫.多线程爬虫与多进程爬虫的主要内容,如果未能解决你的问题,请参考以下文章

多线程 多进程 协程 Queue(爬虫代码)

Python脚本-爬虫与多线程

Python脚本-爬虫与多线程

Python多线程和多进程爬虫

爬虫热身——性能相关

python爬虫入门利用多线程爬虫