爬取百度热议榜单

Posted 3072952697whl

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬取百度热议榜单相关的知识,希望对你有一定的参考价值。

代码:

import pandas as pd
import requests as rq
from bs4 import BeautifulSoup
url="技术图片http://tieba.baidu.com/hottopic/browse/topicList?res_type=1"

def res_caputure():
    try:
        res = rq.get(url,timeout=30)
        res.raise_for_status()
        res.encoding = res.apparent_encoding
        return res.text
    except:
        return "发生异常,响应码为{}".format(res.status_code)
    
if __name__ == "__main__":
    r = res_caputure()
    soup = BeautifulSoup(r)
    a = soup.select(‘a[target]‘)
    p = soup.select(‘span‘)
    soup_p=[]
    soup_a=[]
    s=input("输入要查看百度贴吧话题热议榜单的条数(直接回车默认为10条,最高为30):")
    
    if s==‘‘:
        s=10
    else:
        s=int(s)
        
    for k in range(3,s*2+3,2):
        soup_p.append(p[k].string)
    for i in range(0,s):
        soup_a.append(a[i].string)
    dt={‘排名‘:range(1,s+1),‘标题‘:soup_a,‘内容数‘:soup_p}
    df=pd.DataFrame(dt)
    print(df)

这个爬取代码有一部分是我在网上查找的,勿喷。

 技术图片

技术图片

技术图片

以上是关于爬取百度热议榜单的主要内容,如果未能解决你的问题,请参考以下文章

爬虫爬取千千音乐榜单音乐

豆瓣近五年书籍榜单爬取流程

爬取哔哩哔哩影视榜单

爬取酷狗音乐Top500榜单

爬虫实战01——爬取猫眼电影top100榜单

使用requests爬取猫眼电影TOP100榜单