获取网易全站热点前十及其点击量

Posted l787979852

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了获取网易全站热点前十及其点击量相关的知识,希望对你有一定的参考价值。

import requests
from bs4 import BeautifulSoup
import bs4

ulist=[]#定义一个空列表

def gethtmlText(url):
    try:
        headers =  { User-Agent: 5498}
        r = requests.get(url, timeout=30, headers=headers)#输入获取的url信息,输出是url的内容
        r.raise_for_status()               #用raise_for_status产生异常信息
        r.encoding = r.apparent_encoding  # 修改编码
        return r.text    #将网页的内容返回给程序的其他部分
    except:
        return ""       #出现错误,则返回空字符串
    
def fillList(ulist, html):
    soup = BeautifulSoup(html, "html.parser")
    for tr in soup.find(tbody).children:   #for语句查找tbody标签,并且将孩子children遍历
#isinstance对函数进行判断,检测tr标签的类型,如果tr不是bs4定义的Tag类型,  
#将过滤掉(并且为了代码可以运行需要引入一个新的类型bs4)
        if isinstance(tr, bs4.element.Tag):
            tds = tr(td)    #将所有的td 标签存为一个列表类型
            ulist.append([tds[1].string, tds[2].string])
            
def printList(ulist, num):           #将ulist信息打印出来
    print("{:^6}	{:^10}".format("            标题", "                         点击量"))
    #下面实现对其他信息的打印
    for i in range(num):
        u = ulist[i]
        print("{:^6}	{:^10}".format(u[0], u[1]))
        
def main():
    # 新闻信息放到列表中
    uinfo = []       
    url = "https://tophub.today/n/G2me35rvwj"
    # 将url转换成html
    html = getHTMLText(url)   
    fillList(uinfo, html)
    printList(uinfo, 10)    
    
main()

 

main()技术图片技术图片技术图片

 

以上是关于获取网易全站热点前十及其点击量的主要内容,如果未能解决你的问题,请参考以下文章

爬虫爬取网易云歌单

爬取百度实时热点前十排行榜

如何通过 viewModels 获取 viewModel? (片段-ktx)

求解:db2数据库表Tab中无id,且数据量较大,如何指定查询中间十条数据,不是前十条,谢了。

分享几个实用的代码片段(第二弹)

分享几个实用的代码片段(第二弹)