微信公众号的文章爬取有三种方式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了微信公众号的文章爬取有三种方式相关的知识,希望对你有一定的参考价值。


a. 通过微信订阅号在发布文章,可以查找公众号的文章,方式见微信链接。,阅读数、点赞数、评论数仍无法抓取。

b. 通过搜狗微信搜索微信公众号,但是文章篇幅仍然后有限制,点赞、阅读数、和评论数无法抓取。

c. 通过“中间人方式”对数据进行拦截,过滤解析后进行抓取。

这里就时利用第三种c方式对数据进行抓取。

思路:

1. 安装代理AnProxy,在手机端安装CA证书,启动代理,设置手机代理;

2. 获取目标微信公众号的__biz;

3. 进入微信公众号的历史页面;

4. 使用Monkeyrunner控制滑屏;获取更多的历史消息;

5. 记录文章标题,摘要,创建时间,创作类型,地址等等;

6. 文章列表获取完成后,利用Monkeyrunner进入文章的列表,

7. 记录文章的阅读数,点赞数,评论数等;

8. 重复以上操作。

以上是关于微信公众号的文章爬取有三种方式的主要内容,如果未能解决你的问题,请参考以下文章

如何抓取微信所有公众号最新文章

微信公众号批量爬取java版

基于anyproxy的微信公众号文章爬取,包含阅读数点赞数

python爬微信公众号前10篇历史文章

Python爬虫实战微信公众号爬虫:微信公众号浏览自动化

微信公众号开发用户关注