Python爬虫编程思想(103):项目实战--抓取QQ空间说说的内容
Posted 蒙娜丽宁
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(103):项目实战--抓取QQ空间说说的内容相关的知识,希望对你有一定的参考价值。
本例使用Selenium完成一个综合项目,该项目可以QQ空间说说的内容。首先需要分析一下QQ空间说说的html代码。
由于进入QQ空间需要登录,所以抓取QQ空间说说的内容需要如下2步:
- 模拟登录
- 抓取QQ控件说说的内容
完整这个爬虫的关键点是模拟登录,现在通过下面URL进入QQ空间说说页面,请将qq换成自己的QQ号。
http://user.qzone.qq.com/qq/311
不过如果事先没有登录,那么会显示登录页面。可以通过多种方式登录,例如,用QQ扫描二维码,账号密码登录等,现在切换到账号密码登录状态,如图1所示。
以上是关于Python爬虫编程思想(103):项目实战--抓取QQ空间说说的内容的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫编程思想(91):项目实战--支持搜索功能的图片爬虫
Python爬虫编程思想(91):项目实战--支持搜索功能的图片爬虫
Python爬虫编程思想(143):项目实战:多线程和多进程爬虫
Python爬虫编程思想(143):项目实战:多线程和多进程爬虫