遇到的反爬虫策略以及解决方法?

Posted sea-stream

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了遇到的反爬虫策略以及解决方法?相关的知识,希望对你有一定的参考价值。

 

  • 通过headers反爬虫:自定义headers,添加网页中的headers数据。
  • 基于用户行为的反爬虫(封IP):可以使用多个代理IP爬取或者将爬取的频率降低。
  • 动态网页反爬虫(JS或者Ajax请求数据):动态网页可以使用 selenium + phantomjs 抓取。
  • 对部分数据加密处理(数据乱码):找到加密方法进行逆向推理。

 

以上是关于遇到的反爬虫策略以及解决方法?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用python解决网站的反爬虫

常见的反爬虫和应对方法

常见的反爬虫和应对方法

常见的反爬虫和应对方法

网站常见的反爬虫和应对方法

常见的反爬虫和应对方法