python学习5 爬虫老是被封如何解决

Posted 哈弗h6

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python学习5 爬虫老是被封如何解决相关的知识,希望对你有一定的参考价值。

先设置等待时间:

常见的设置等待时间有两种,一种是显性等待时间(强制停几秒),一种是隐性等待时间(看具体情况,比如根据元素加载完成需要时间而等待)图 1 是显性等待时间设置,图 2 是隐性。

 

技术图片
 

 

 

技术图片
 

 

第二步,修改请求头:

 

识别你是程序还是网友浏览器浏览的重要依据就是 User-Agent,比如网友用浏览器浏览就会使这个样子的 User-Agent:’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36’

 

技术图片
 

 

第三步,采用代理 ip / 建代理 ip 池

直接看代码。利用动态 ip 代理,可以强有力地保障爬虫不会被封,能够正常运行。图 1 为使用代理 ip 的情况,图 2 是建 ip 代理池的代码,有没有必要需要看自己的需求,大型项目是必须用大量 ip 的。

 

技术图片

以上是关于python学习5 爬虫老是被封如何解决的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫防止IP被封的一些措施,强烈建议收藏转发

如何处理python爬虫ip被封

如何处理python爬虫ip被封

如何处理python爬虫ip被封

6年程序员大佬如何处理Python爬虫ip被封的问题呢?

爬虫-IP被封解决办法