python 微信公众号文章抓取阅读数和点赞数
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 微信公众号文章抓取阅读数和点赞数相关的知识,希望对你有一定的参考价值。
# !/usr/bin/env python
# -*- coding: utf-8 -*-
import sys
import json
from urlparse import urlparse, parse_qs
import requests
def getappmsgext(key, uin, url):
"""
:param key: 访问者的秘钥
:param uin: 访问者的ID(base64编码)
:param url: 需要抓取的文章链接
:return:
"""
qs = dict((k, v if len(v) > 1 else v[0])
for k, v in parse_qs(urlparse(url).query).iteritems())
params = {
"__biz": qs.get('__biz'),
"mid": qs.get('mid'),
"sn": qs.get('sn'),
"idx": qs.get('idx'),
"f": "json",
"is_need_ad": 0,
"key": key,
"uin": uin,
}
data = {
'is_only_read': 1,
}
api = 'http://mp.weixin.qq.com/mp/getappmsgext'
resp = requests.post(api, headers=headers, params=params, data=data)
json.dump(resp.json(), sys.stdout, indent=4, ensure_ascii=False)
article_url = 'https://mp.weixin.qq.com/s?__biz=MjM5NDAwMTA2MA==&mid=434466335&idx=1&sn=4b63bd2d8968487ad59abcf31b7c8b72'
"""
通过微信电脑版发起一个对话,粘贴以下URL发送,然后点击URL
1. 复制浏览器地址栏中的地址为key_url
2. 提取Cookie值wap_sid,设置为headers
https://mp.weixin.qq.com/s?__biz=MjM5NTE4Njc4NQ==&mid=405483849&idx=1&sn=cac39a93ea4058564cd81e6627060d2d#wechat_redirect
"""
headers = {
'User-Agent': 'Version/4.0 Mobile Safari/533.1 MicroMessenger/4.5.255',
'Cookie':'wap_sid=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
}
key_url = 'https://mp.weixin.qq.com/s?__biz=MjM5NTE4Njc4NQ==&mid=405483849&idx=1&sn=cac39a93ea4058564cd81e6627060d2d&uin=ODg4ODg4ODg%3D&key=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx&devicetype=iMac+MacBook8%2C1+OSX+OSX+10.11.5+build(15F34)&version=11020201&lang=zh_CN&pass_ticket=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
qs = dict((k, v if len(v) > 1 else v[0]) for k, v in parse_qs(key_url).iteritems())
uin = qs.get('uin')
key = qs.get('key')
getappmsgext(key, uin, article_url)
"""
{
...
"appmsgstat": {
...
"read_num": 100001,
"like_num": 2512
}
}
"""
以上是关于python 微信公众号文章抓取阅读数和点赞数的主要内容,如果未能解决你的问题,请参考以下文章
使用fiddler抓取微信公众号文章的阅读数点赞数评论数
基于anyproxy的微信公众号文章爬取,包含阅读数点赞数
Facebook 图形 API 用于获取带有评论数和点赞数的 Facebook 订阅源
仿微信公众号文章实现微信营销活动推广页面的方法
如何使用python3抓取微信公众号文章,了解一下?
基于搜狗微信搜索获取公众号文章的阅读量及点赞量