Python爬虫编程思想(103):项目实战--抓取QQ空间说说的内容

Posted 蒙娜丽宁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(103):项目实战--抓取QQ空间说说的内容相关的知识,希望对你有一定的参考价值。

        本例使用Selenium完成一个综合项目,该项目可以QQ空间说说的内容。首先需要分析一下QQ空间说说的html代码。

由于进入QQ空间需要登录,所以抓取QQ空间说说的内容需要如下2步:

  1. 模拟登录
  2. 抓取QQ控件说说的内容

        完整这个爬虫的关键点是模拟登录,现在通过下面URL进入QQ空间说说页面,请将qq换成自己的QQ号。

http://user.qzone.qq.com/qq/311

        不过如果事先没有登录,那么会显示登录页面。可以通过多种方式登录,例如,用QQ扫描二维码,账号密码登录等,现在切换到账号密码登录状态,如图1所示。

以上是关于Python爬虫编程思想(103):项目实战--抓取QQ空间说说的内容的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(91):项目实战--支持搜索功能的图片爬虫

Python爬虫编程思想(91):项目实战--支持搜索功能的图片爬虫

Python爬虫编程思想(143):项目实战:多线程和多进程爬虫

Python爬虫编程思想(143):项目实战:多线程和多进程爬虫

Python爬虫编程思想(126):项目实战--实时抓取“得到”App在线课程

Python爬虫编程思想(126):项目实战--实时抓取“得到”App在线课程