获取微博广告博文数据

Posted Erick - LONG

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了获取微博广告博文数据相关的知识,希望对你有一定的参考价值。

import requests
import json
import pandas as pd
import time
import re 

headers = {
    User-Agent: XXXX,
    Cookie: XXX}

def get_ad(page):
    url = https://m.weibo.cn/api/container/getIndex?containerid=102803&openApp=0&since_id={}.format(page)

    res = requests.get(url,headers=headers)
    data = json.loads(res.text)
    all_ad = []
    for k,i in enumerate(data[data][cards]):
        aa = i[mblog].get(from_cateid)
        if aa in [Brand,Sfst,FanstopExtend,Wax]:
            result={}
            pattern = re.compile(r<.*?>) 
            cc = pattern.sub(‘‘,i[mblog][text])
            result[uid] = i[mblog][user][id]
            result[昵称] = i[mblog][user][screen_name]
            result[排名] = k+1
            result[出现页数] = page+1
            result[博文] = cc
            result[转发数] = i[mblog][reposts_count]
            result[评论数] = i[mblog][comments_count]
            result[点赞数] = i[mblog][attitudes_count]
            all_ad.append(result)
    return all_ad

all_data = []

for i in range(50):
    time.sleep(1)
    print(len(all_data))
    fina_data = get_ad(i)
    if fina_data:
        all_data+=fina_data

df1 =pd.DataFrame(all_data)
df1.to_excel(result+time.strftime("%Y%m%d%H%M%S")+.xlsx,index=False)
print(done)

 

以上是关于获取微博广告博文数据的主要内容,如果未能解决你的问题,请参考以下文章

PHP 基于laravel框架获取微博数据之二 用户数据的使用

PHP 基于laravel框架获取微博数据之二 用户数据的使用

微博广告Hubble系统:秒级大规模分布式智能监控平台架构实践

日均百亿级日志处理:微博基于Flink的实时计算平台建设

微博大规模分布式AIOps系统探索与实践(赠重磅好书)

荐读!微博大规模分布式 AIOps 系统探索与实践