傻瓜式下载“喜马拉雅”音频文件

Posted aby321

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了傻瓜式下载“喜马拉雅”音频文件相关的知识,希望对你有一定的参考价值。

 

今天刷水木看到一个问贴,如何下载喜马拉雅音频文件?

看了几个回帖,有人说app端可以下载,有人说需要解密,也有人说可以用录屏大师翻录一下

这里,我提出一个新的解决办法,就是从原网页中抽丝剥茧的找到源文件,直接右键下载到本地

当然,如果是批量下载的话需要借住python3爬虫,因为是格式化的json数据,找到了规则非常简单,可以参考我之前写的网易云歌曲的下载方法

这里就不再重复贴出代码了

 


 

 

 首先打开喜马拉雅网页版,随便点击一个节目,这里我用平时常听的“早安英文”举例

https://www.ximalaya.com/waiyu/3373990/222313675

技术图片

 

 按F12打开开发者工具,然后选择network下的ALL或者XHL

技术图片

 

 

点击播放音频按键,观察开发者工具中的变化,可以发现迅速的刷新出来很多条

找到开头为audio的这一条(不要问我为什么不选其他的,这是爬多了的经验啊经验!)

技术图片

 

 单击这一条,观察右侧,copy出来框图的网址,在浏览器中打开此网址

技术图片

 

这里推荐使用Chrome浏览器,并且使用FEhelper这个插件,因为网址中的数据是json格式的,用这个插件会自动美化

技术图片

 

 copy上图中src这个链接,通过浏览器打开会有惊喜呦,如下图所示:

技术图片

 

 点击旁边的“点点点”就下载就ok啦(不同的浏览器可能会略有区别)

技术图片

 

 测试了一下,可以正常播放,默认的文件格式是.m4a(我也不造这是啥格式嘛……)

 

至此,怎么下载单个音频文件搞定了。

总结一下规律,其实就是找到scr这个链接,但是发现这个链接音频的命名貌似并没有什么规律可循,因此还是要追溯到上一层级

https://www.ximalaya.com/revision/play/v1/audio?id=222313675&ptype=1

我们来看一下这个网址的规则,其实就是id不同,那么对于其他的节目而言,只要把id值更换即可

id值就是原网页中的啦https://www.ximalaya.com/waiyu/3373990/222313675 红色部分啦

bingo!

 

以上是关于傻瓜式下载“喜马拉雅”音频文件的主要内容,如果未能解决你的问题,请参考以下文章

JS + shell 批量下载 喜马拉雅FM 的音频

如何用Python爬取喜马拉雅全网音频文件

企鹅FM音频下载器V1.0 企鹅FM下载器

Python中使用requests和parsel爬取喜马拉雅电台音频

音频喜马拉雅学习平台怎么样?

Python爬虫音频数据