Python爬虫编程思想(133):项目实战--利用Appium抓取微信朋友圈信息
Posted 蒙娜丽宁
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(133):项目实战--利用Appium抓取微信朋友圈信息相关的知识,希望对你有一定的参考价值。
本文利用Appium实现一个抓取微信朋友圈信息的爬虫。在编写爬虫之前,先要启动Appium服务器。
编写基于Appium的爬虫,关键就是分析App每个界面相关元素的特征,也就是如何获取这些元素,然后在这些元素上执行特定的动作,如点击、输入字符串等。
微信App的大多数元素都是单一的元素,如按钮、文本框等,直接使用Appium很容易定位。比较复杂的是朋友圈信息,编写过android App的读者应该可以猜到,朋友圈很明显是一个列表,在Android App中,列表通常用ListView控件实现,而且采用了动态向ListView控件添加Item的方式。所以首先要定位到这个现实朋友圈的ListView控件。
将微信App切换到朋友圈页面,然后刷新Appium,会在左侧看到朋友圈页面,然后将微信App的朋友圈向下滚动,这是在Appium上定位,会找到如图1所示的ListView控件,而每一个Item就是一个FrameLayout。每一个FrameLayout的id都是一样的。这个id是com.tencent.mm:id/emw,所以我们只需要获得当前页面所有ID是com.tencent.mm:id/
以上是关于Python爬虫编程思想(133):项目实战--利用Appium抓取微信朋友圈信息的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫编程思想(91):项目实战--支持搜索功能的图片爬虫
Python爬虫编程思想(91):项目实战--支持搜索功能的图片爬虫
Python爬虫编程思想(143):项目实战:多线程和多进程爬虫
Python爬虫编程思想(143):项目实战:多线程和多进程爬虫