Python爬虫爬取酷狗音乐网络红歌榜

Posted 2021-03-21 点滴记忆

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python爬虫爬取酷狗音乐网络红歌榜相关的知识，希望对你有一定的参考价值。

原理：我的上篇博客

import requests
import time
from bs4 import BeautifulSoup


def get_html(url):
    \'\'\'
    获得 HTML
    \'\'\'
    headers = {
        \'user-agent\': \'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/53\\
        7.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36\'
    }
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        return response.text
    else:
        return


def get_infos(html):
    \'\'\'
    提取数据
    \'\'\'
    html = BeautifulSoup(html)
    # 排名#
    ranks = html.select(\'#rankWrap > div.pc_temp_songlist > ul > li > span.pc_temp_num\')
    # 歌手 + 歌名
    names = html.select(\'#rankWrap > div.pc_temp_songlist > ul > li > a\')
    # 播放时间
    times = html.select(\'#rankWrap > div.pc_temp_songlist > ul > li > span.pc_temp_tips_r > span\')

    # 打印信息
    for r,n,t in zip(ranks,names,times):
        r = r.get_text().replace(\'\\n\',\'\').replace(\'\\t\',\'\').replace(\'\\r\',\'\')
        n = n.get_text()
        t = t.get_text().replace(\'\\n\',\'\').replace(\'\\t\',\'\').replace(\'\\r\',\'\')
        data = {
            \'排名\': r,
            \'歌名-歌手\': n,
            \'播放时间\': t
        }
        print(data)


def main():
    \'\'\'
    主接口
    \'\'\'
    urls = [\'https://www.kugou.com/yy/rank/home/{}-23784.html?from=rank\'
                .format(str(i)) for i in range(1, 6)]
    for url in urls:
        html = get_html(url)
        get_infos(html)
        time.sleep(1)


if __name__ == \'__main__\':
    main()

结果：

以上是关于Python爬虫爬取酷狗音乐网络红歌榜的主要内容，如果未能解决你的问题，请参考以下文章