爬虫

Posted quanag

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫相关的知识,希望对你有一定的参考价值。

报错自查

# 1、 HttpConnectionPool:
# 原因: 1、短时间内发起了高频的请求导致IP被禁
# 2、http连接池中的连接资源被耗尽
# 解决:
# 1、 使用代理服务器
# 2、headers中加入 Connection: ‘close‘

# 2、代理:代理服务器,可以接受请求将其转发。
# 匿名度:
# 高匿名:啥也不知道
# 匿名:知道你使用了代理,但是不知道你的真实IP
# 透明:知道你使用了代理并且知道你的真实IP
# 类型:
# http
# https
# 免费代理:
# www.goubanjia.com
# 快代理
# 西祠代理
# 收费:
# http://http.zhiliandaili.cn/ 代理精灵
    
    # cookie的处理










---------------------   end  --------------------------





























以上是关于爬虫的主要内容,如果未能解决你的问题,请参考以下文章

NIH周三讲座视频爬虫

Python练习册 第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-),(http://tieba.baidu.com/p/2166231880)(代码片段

python爬虫学习笔记-M3U8流视频数据爬虫

爬虫遇到头疼的验证码?Python实战讲解弹窗处理和验证码识别

python网络爬虫

在学习爬虫的路上,有多少坑在前边