selenium+scrapy完成爬取特定的知乎界面,比如我爬取的就是搜索“”“某某某东西”

Posted rabbit-working

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了selenium+scrapy完成爬取特定的知乎界面,比如我爬取的就是搜索“”“某某某东西”相关的知识,希望对你有一定的参考价值。

这个地方非常感谢此篇作者的帮助 :http://blog.csdn.net/uselym/article/details/52525025

一、建立一个scrapy框架的爬虫

二、在spider中首先构造登录

技术分享图片

二、使用response构造需要获取到的数据

技术分享图片

三、在parse函数中返回request请求。

四、在scrapy.Request()中指定url=“你需要爬取的界面”

总结:对于知乎的动态界面,scrapy爬虫爬取始终没有selenium模拟上下滑动获取的比较完整,望注意。

 

以上是关于selenium+scrapy完成爬取特定的知乎界面,比如我爬取的就是搜索“”“某某某东西”的主要内容,如果未能解决你的问题,请参考以下文章

scrapy爬取知乎问答

使用scrapy爬取知乎图片

爬虫实战--利用Scrapy爬取知乎用户信息

Python爬虫实战,Scrapy实战,爬取知乎表情包

Scrapy爬取知乎用户信息

Scrapy+selenium爬取简书全站