day35 爬虫简述

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了day35 爬虫简述相关的知识，希望对你有一定的参考价值。

爬虫概要

　　性能相关：

　　　　- 线程池

　　　　- 进程池

　　　　-　异步非阻塞，

　　　　　　- （异步=回调，非阻塞=不等待）遇到IO请求不等待，继续执行其他任务，如果IO请求响应内容回来了，自动回调执行某个函数

　　　　　　- 协程

　　　　- twisted

　　　　- gevent

　　　　　　- greenlet，协程

　　　　　　- libevent

　　　　- asyncio

　　　　- tornado

　　Scrapy框架

　　　　- 性能相关： twisted

　　　　- URL

　　　　- 对象， #id

　　　　redis-scrapy

1. 基本爬虫

　　- 基本获取页面指定内容
　　- 登录之后
　　　　- github
　　　　- chouti
　　　　- 博客园（用户名密码加密）
　　　　　　- 用户名和密码
　　　　- 知乎，新浪微博（图片验证码）
　　　　　　- 第三方
　　　　　　- xxx

课堂代码：

https://github.com/liyongsan/git_class/tree/master/day35/s16day35

以上是关于day35 爬虫简述的主要内容，如果未能解决你的问题，请参考以下文章