爬取百度实时热点前十排行榜

Posted abc2920736782

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬取百度实时热点前十排行榜相关的知识,希望对你有一定的参考价值。

import requests#导入相应库
from bs4 import BeautifulSoup
import pandas as pd
url = ‘http://top.baidu.com/buzz?b=1&c=513&fr=topbuzz_b341_c513‘#要爬取的网址
headers = {‘User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/69.0.3497.100 Safari/537.36‘}
res=requests.get(url,timeout=30)#发送请求
res.encoding=res.apparent_encoding
soup=BeautifulSoup(res.text,‘html.parser‘)#使用“美味的汤”工具
x=[]#创建空列表
y=[]
for link1 in soup.find_all(class_=‘list-title‘):
x.append(link1.get_text())
for link2 in soup.find_all(‘td‘,class_=‘last‘):
y.append(link2.get_text().strip())
data=pd.DataFrame([x,y],index=["标题","热度"]).T
print("爬取百度实时热点排行榜前十:"," ")
print(data.iloc[0:10])

技术图片

 

 

 

 

 

1.打开网站网址:http://top.baidu.com/buzz?b=1&c=513&fr=topbuzz_b341_c513

2.导入相应爬虫工具。

3.按下F12获得相应源代码

技术图片

 

4.找到相应的数据进行爬取。

5.得出结果

技术图片

 

以上是关于爬取百度实时热点前十排行榜的主要内容,如果未能解决你的问题,请参考以下文章

爬取360影视排行榜-总榜

爬取百度热门排行

Python爬虫收集今日热榜数据:聚合全网热点排行榜

Q新闻丨Go 语言排行飙升至前十;GitHub 已切换到 Kubernetes;陆奇最新内部演讲:如何成为一个优秀的工程师?

3 月编程排行榜:Ruby 重回前十,Kotlin 突围

最权威编程语言排行榜发布6月更新,TypeScript首进前十