爬取百度热点前十名

Posted yyy6265

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬取百度热点前十名相关的知识,希望对你有一定的参考价值。

技术图片技术图片技术图片
 1 import requests
 2 from bs4 import BeautifulSoup
 3 import pandas as pd
 4 #获取html网页
 5 url = http://top.baidu.com/buzz.php?p=top10&tdsourcetag=s_pctim_aiomsg&qq-pf-to=pcqq.c2c?
 6 kv = {user-agent: Mozilla/5.0}#伪装爬虫
 7 r = requests.get(url,timeout = 30,headers=kv)
 8 r.raise_for_status()
 9 r.encoding = r.apparent_encoding
10 r.text#获取源代码
11 html=r.text
12 soup=BeautifulSoup(html,html.parser)
13 #解析网页,提取内容
14 a = []#创建空列表
15 b = []
16 for x in soup.find_all(class_="list-title")[:10]:
17     a.append(x.get_text().strip())
18 for y in soup.find_all(class_="icon-rise")[:10]:
19     b.append(y.get_text().strip())
20 text =[a,b]
21 print(text)
22 c=pd.DataFrame(text,index=["标题","热度"])
23 print(c.T)

技术图片

 

 

 

以上是关于爬取百度热点前十名的主要内容,如果未能解决你的问题,请参考以下文章

爬取百度实时热点前十排行榜

用pyquery5行代码爬取百度热点新闻

Python爬取百度实时热点排行榜

爬虫 -----爬取百度时事热点和url

Python爬虫 - 爬取百度html代码前200行

web scraper——简单的爬取数据