python爬千千音乐
Posted lygl
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬千千音乐相关的知识,希望对你有一定的参考价值。
模拟浏览器,访问互联网资源,根据所写的规则,下载所需的音乐数据!
源代码查看:在更多工具里的开发者工具(shift+ctrl+I 或f12)
在谷歌浏览器中登入千千音乐 http://music.taihe.com
在pycharm写代码
在Terminal中输入pip install requests回车即安装requests
程序代码:
import requests
import re
#第一步 获取歌曲ids
search_api =‘http://music.taihe.com/search‘
#搜索的关键字,传递参数,通过字典构造
keyword = {‘key‘:‘阿兰‘}
#发送请求
#get请求 params 是传递的get参数
response=requests.get(search_api,params=keyword)
#取出html的源码
response.encoding=‘utf-8‘
html = response.text
#通过正则表达式获取id
ids=re.findall(r‘{"id":"(d+)"‘,html)
print(ids)
#第二步 获取歌曲的信息
mp3_info_api =‘http://play.taihe.com/data/music/songlink‘
data ={
‘songIds‘: ‘,‘.join(ids),
‘hq‘: 0,
‘type‘: ‘m4a,mp3‘,
‘rate‘: ‘‘,
‘pt‘: 0,
‘flag‘: -1,
‘s2p‘: -1,
‘prerate‘: -1,
‘bwt‘: -1,
‘dur‘: -1,
‘bat‘: -1,
‘bp‘: -1,
‘pos‘: -1,
‘auto‘: -1
}
#data就是post的参数
res = requests.post(mp3_info_api,data=data)
#返回的数据是json格式 直接调用json方法,转成字典
info = res.json()
#第三步 去下载歌曲
#根据数据的结构,获取歌曲的信息
song_info =info[‘data‘][‘songList‘]
#循环
for song in song_info:
#根据数据结构获取信息
#歌名
song_name = song[‘songName‘]
#mp3地址
song_link = song[‘songLink‘]
#格式
for_mat = song[‘format‘]
#歌词地址
lrclink = song[‘lrcLink‘]
# print(song_name,song_link,for_mat,lrclink)
#下载mp3
if song_link:#有可能没有地址
song_res =requests.get(song_link)
with open(‘%s.%s‘ % (song_name,for_mat),‘wb‘)as f:
f.write(song_res.content)
print(song_link)
#下载歌词
if lrclink:
lrc_response = requests.get(lrclink)
#写文件
with open(‘%s,lrc‘ % song_name, ‘w‘)as f:
f.write(lrc_response.text)
以上是关于python爬千千音乐的主要内容,如果未能解决你的问题,请参考以下文章