python爬虫,遇到403 forbidden,求助

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫,遇到403 forbidden,求助相关的知识,希望对你有一定的参考价值。

参考技术A

遇到这种情况一般是爬虫被网站发现而禁止了,在这种情况下就要考虑爬取策略,一般有以下几种方法,从简单到容易:

    设置ua

    添加requests的headers,如refer,content length等

    添加cookie

    爬取过于频繁,每爬完一个网页sleep一段时间,一般1-5秒,越长越不容易被检测出来,也可以考虑sleep随机的时间

    终极大杀招,模拟浏览器,selenium工具

具体方法自行google

本回答被提问者和网友采纳

以上是关于python爬虫,遇到403 forbidden,求助的主要内容,如果未能解决你的问题,请参考以下文章

爬虫之遇到403 Forbidden,你该怎么办?

Python爬虫报错:"HTTP Error 403: Forbidden"

Python爬虫403错误的解决方案

爬虫403问题解决urllib.error.HTTPError: HTTP Error 403: Forbidden

谁遇到过post请求时发生403forbidden

urllib2.HTTPError: HTTP Error 403: Forbidden 请高手指点,python菜鸟一枚