bibli直播弹幕实时爬取
Posted angle6-liu
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了bibli直播弹幕实时爬取相关的知识,希望对你有一定的参考价值。
1 分析数据来源
- 在不知道弹幕信息在哪里的时候,只能去all里面查看每一个相应的信息,看信息是否含有弹幕信息
- 在知道弹幕信息文件的时候,我们可以直接用全局文件搜索,定位到弹幕数据文件.操作如下图
2 查看文件的请求信息
3 查看请求头信息,构建请求头
- 请求头;
headers={ ‘Content-Type‘:‘application/x-www-form-urlencoded‘, ‘Origin‘: ‘https://live.bilibili.com‘, ‘Referer‘:‘https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5‘, ‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/72.0.3626.119 Safari/537.36‘, }
- 请求体数据
data={ ‘roomid‘: ‘7734200‘, #房间号 ‘csrf_token‘: ‘fa56950667934cf5a3479ca94abc1f9a‘, ‘csrf‘: ‘fa56950667934cf5a3479ca94abc1f9a‘, ‘visit_id‘: ‘‘, }
4 代码
import requests import time
#请求头 headers={ ‘Content-Type‘:‘application/x-www-form-urlencoded‘, ‘Origin‘: ‘https://live.bilibili.com‘, ‘Referer‘:‘https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5‘, ‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36‘, }
#请求体 data={ ‘roomid‘: ‘7734200‘, ‘csrf_token‘: ‘fa56950667934cf5a3479ca94abc1f9a‘, ‘csrf‘: ‘fa56950667934cf5a3479ca94abc1f9a‘, ‘visit_id‘: ‘‘, } url=‘https://api.live.bilibili.com/ajax/msg‘
#实时请求数据 while True: time.sleep(2) response=requests.post(url=url,headers=headers,data=data) dic_data=response.json() # print(type(dic_data)) content=[item[‘text‘] for item in dic_data[‘data‘][‘room‘]] print(content)
5 效果
以上是关于bibli直播弹幕实时爬取的主要内容,如果未能解决你的问题,请参考以下文章
一对多直播系统开发,百万用户在线,直播弹幕系统是如何实现的?