Python3，早知道3行代码就能提取音频，我把这10块钱买包子吃不香吗？

Posted 2023-03-31 Carl_奕然

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python3，早知道3行代码就能提取音频，我把这10块钱买包子吃不香吗？相关的知识，希望对你有一定的参考价值。

3行代码提取音频

1、引言
2、代码实战
3、总结

1、引言

小屌丝：鱼哥，我想从视频中单独把音频提取出来，有什么办法吗？
小鱼：你直接用软件就可以实现啊。
小屌丝：那不得用钱吗
小鱼：…你想白嫖？？
小屌丝：不，我要靠自己的技术!
小鱼：那你靠吧！
小屌丝：这不能没有你的支持。
小鱼：合着你这是鲜花，我是绿叶？
小屌丝：不，你是根，没有根，哪有花啊…
小鱼：呵，合着我还是得给你做贡献呢？
小屌丝：鱼哥，你就说有没有那么一个库，能干这件事？
小鱼：有，那肯定是有的…
小屌丝：我懂，老规矩。
小鱼：那，开整。

2、代码实战

2.1 第三方库介绍

今天就来介绍一个能从视频中只提取音频的库-----ffmpy。
可能很多人没有提说过这个库，但是，FFmpeg 大家应该都能听过，
可以运行音频和视频多种格式的录影、转换、流功能，
说到这，不得不提两个库：

libavcodec：用于多个项目中音频和视频的解码器库
libavformat：一个音频与视频格式转换库

而在Python中，FFmpeg 与ffmpy是对应的。所以，

2.2 安装

老规矩，直接pip 安装

pip install ffmpy3

其他方式安装：

《Python3，选择Python自动安装第三方库，从此跟pip说拜拜！！》
《Python3：我低调的只用一行代码，就导入Python所有库！！》

2.3 代码实例

由于代码很简洁，咱就直接上代码

# -*- coding:utf-8 -*-
# @Time   : 2022-03-13
# @Author : carl_DJ

import uuid
import os
import  ffmpy3


'调用FFmpeg提取音频'
#传入三个参数：视频地址，音频结果存入地址，音频的格式后缀
def run_ffmpeg(video_path:str,audio_path:str,format:str):
	ff=  ffmpy3.FFmpeg(inputs =  video_path:None,outputs = audio_path:'-f -vn'.format(format))
		ff.run()
	return audio_path
	
'接收参数'
def extract(video_path:str,tmp_dir:str,ext:str):
	file_name = '.'.join(os.path.basename(video_path).split('.')[0:-1])
	temp_name = os.path.join(tmp_dir,'.'.format(uuid.uuid4(),ext))
	return run_ffmpeg(video_path,temp_name,ext)

if __name__ == "__main__":
	print(extract('D:\\project\\kd.mp4','D:\\project\\video','wav'))

运行后，会生成一个文件夹为uuid的wav格式音频文件。

3、总结

看到这里，今天的分享就差不多到这里了。
主要是提取音频的内容，
而ffmpy3还有很多功能，，可以参照官方文档。

n行Python代码系列：三行代码提取视频的音频

☞ ░ 老猿Python博文目录 ░

一、引言

最近看到好几篇类似“n行Python代码…”的博文，看起来还挺不错，简洁、实用，传播了知识、带来了阅读量，撩动了老猿的心，决定跟风一把，推一个“n行Python代码系列”文章。

本文介绍从视频中提取声音输出的三行代码的极简实现。后续更多“n行Python代码系列”文章请参考免费专栏《n行Python代码系列》。

二、三行代码提取视频的音频

from  moviepy.editor import *

video = VideoFileClip(r"F:\\video\\fansNote1M_crop.mp4")
video.audio.write_audiofile(r"F:\\video\\fansNote.mp3")

上面3行代码先加载moviepy模块、加载视频、然后将视频的音频直接输出，实际上这三行代码可以合并成两行。

程序运行效果：

可以看到视频中的音频已经成功输出。

三、背景知识

3.1、moviepy介绍

要实现视频剪辑，老猿使用了moviepy库。

MoviePy是一个用于视频编辑的Python模块，可用于进行视频的基本操作（如剪切、连接、标题插入）、视频合成（也称非线性编辑）、视频处理或创建高级效果。

它可以读写最常见的视频格式，包括GIF。MoviePy能处理的视频是ffmpeg格式的，老猿理解支持的文件类型至少包括：*.mp4 *.wmv *.rm *.avi *.flv *.webm *.wav *rmvb。

MoviePy使用ffmpeg读取、导出视频和音频文件，使用ImageMagick生成文本和输出GIF文件。Python的快速数字库Numpy保证了不同媒体的处理。高级效果和增强使用了Python的许多图像处理库（PIL、Scikit-image、scipy等）。

moviepy的核心对象是剪辑（clips），包括AudioClips 和VideoClips。它们可以修改（剪切、减速、变暗…）或与剪辑混合以形成新剪辑，可以使用PyGame或IPython Notebook预览，并可以输出到对应类型的文件（如MP4、GIF、 MP3等）。例如，VideoClips可以从视频文件、图像、文本或自定义动画创建。VideoClips可以有一个音频轨道（这是一个AudioClip）和一个mask（一个特殊的VideoClip，指示当剪辑与其他剪辑混合时要隐藏哪些部分）。

3.2、moviepy安装

MoviePy安装非常简单，使用pip安装时，请将站点指向国内的镜像站点，否则下载很慢或者下载不下来，老猿使用清华的镜像，指令是：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple moviepy

注意：

1、moviepy全小写，安装时会自动安装相关依赖包；

2、建议安装最新的版本1.0.3，因为1.0.2中有个比较大的bug，请见《在Python中使用moviepy进行视频剪辑时输出文件报错 ‘NoneType’ object has no attribute 'stdout’问题》；

3、如果没有安装最新版本，可以执行版本升级，指令：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple moviepy --upgrade

关于Moviepy更多的介绍，请参考老猿的免费专栏《PyQt+moviepy音视频剪辑实战》。

3.3、相关函数

上述代码涉及到的相关函数包括VideoFileClip和write_videofile以及audio属性。

3.3.1、VideoFileClip

VideoFileClip实际上是一个类，其构造方法如下：

__init__(self, filename, has_mask=False, audio=True, audio_buffersize=200000,target_resolution=None, resize_algorithm=‘bicubic’,audio_fps=44100, audio_nbytes=2, verbose=False, fps_source=‘tbr’)`

参数说明：

filename：视频文件名，可以带路径
has_mask：是否有遮罩，如果视频文件带遮罩，则设置has_mask为True。视频文件一般很少带遮罩，但有些视频编码支持遮罩功能。例如如果moviepy合成了一个带遮罩的剪辑，则可以使用《moviepy音视频剪辑：视频剪辑基类VideoClip的属性及方法详解》介绍的VideoClip.write_videofile将剪辑和遮罩、音频信息一起保存到视频文件中
audio：如果视频文件不带音频或者不希望加载视频文件的音频，可以将audio参数设置为False
audio_buffersize：音频文件读取缓冲区大小，字节为单位，一般用缺省值足够，如果audio_buffersize比一个音频帧的大小还要小，会自动使用音频帧的大小代替
target_resolution：设置为加载后需要变换到的分辨率，类型为列表或元组，第一个元素为分辨率的高，第二个为宽，如果高或宽有一个为None，则保持现有纵横比调整帧的大小。如果保持原分辨率不变，则不需要设置本参数或设置为None。如果设置了新的分辨率，则在调用ffmpeg 返回视频剪辑的帧之前会按新的分辨率调整帧的大小。这比使用转换为高分辨率流然后再调整分辨率会快很多
resize_algorithm：要改变加载后的视频分辨率，可以通过resize_algorithm指定调整分辨率的算法，缺省值为 “bicubic”，还可以是 “bilinear” 、"fast_bilinear"等。关于算法的更多信息请参考：https://ffmpeg.org/ffmpeg-scaler.html
audio_fps：声音的采样频率
audio_nbytes：声音采样的位数
verbose：是否在标准输出设备上显示处理信息
fps_source：从视频的元数据metadata哪个数据中获取fps值，默认设置为’tbr’，但可以设置为’fps’，这可能有助于导入慢动作视频，否则可能会出意外。

3.3.2、audio属性

audio为VideoFileClip的属性，其内容为视频对应的音频。

3.3.3 write_videofile方法

write_videofile方法用于将视频剪辑输出到文件，调用语法如下：


write_videofile(self, filename, fps=None, codec=None,  bitrate=None, audio=True, audio_fps=44100, preset="medium", audio_nbytes=4, audio_codec=None,audio_bitrate=None, audio_bufsize=2000, temp_audiofile=None, rewrite_audio=True, remove_temp=True,write_logfile=False, verbose=True, threads=None, ffmpeg_params=None,       logger='bar')

参数说明如下：

filename：视频文件名，只要是ffmpeg支持的视频文件如.ogv,.mp4,.mpeg,.avi,.mov等都可以
fps：帧率，每秒编码的帧数
codec：用于图像编码的编解码器，可以是ffmpeg支持的任何编解码器。如果文件名的扩展名为“.mp4”、“.ogv”、“.webm”，则会相应地设置编解码器，但如果不喜欢默认值，则仍可以进行设置。对于其他扩展名，必须相应地设置输出文件名。一些常用的编解码器如下：

√. ‘libx264’：视频压缩效果好的一款编解码器，MP4的缺省编解码器，视频质量通过bitrate参数调节

√. ‘mpeg4’：一种可选的MP4编解码器，可以替代’libx264’，可以获得更好的视频质量

√.‘rawvideo’：完美的视频质量，但文件会巨大，对应视频文件为’.avi’

√. ‘png’：完美的视频质量，对应视频文件为’.avi’，但文件大小比’rawvideo’小

√. ‘libvorbis’：是一种完全开放、免费的编解码器，有不错的视频格式，但是要不广，对应视频文件为’.ogv’

√. ‘libvpx’：一种很适合在HTML5中使用的网络视频轻量级编开源解码器，对应视频文件为’.webm’
bitrate：输出视频的比特率，也即码率BPS（Bits Per Second）,指每秒传送的数据位数
audio：可以为True、False或文件名，如果True且剪辑附加了音频，则音频将作为视频的音频保存，如果为False则不保存音频，如果为音频文件名则将此音频文件将作为视频的音频
audio_fps：声音的采样频率
preset：设置FFMPEG用于优化压缩的时间。字符串类型，可选值有：ultrafast、superfast、veryfast、faster、fast、medium、slow、slower、veryslow、 placebo。请注意，这不会影响视频的质量，只影响视频文件的大小。所以如果赶时间而文件大小不是很重要可以设置为ultrafast
audio_nbytes：音频的采用的位数，对应基于字节为单位就是声道数；
audio_codec：音频解码器，例如’.mp3’的’libmp3lame’、‘ogg’的’libvorbis’、 ‘m4a’的’libfdk_aac’、 ‘pcm_s16le’ 16位声音和’pcm_s32le’的32位声音。默认值为“libmp3lame”，除非视频扩展名为“ogv”或“webm”，在这2种情况下，默认值为“libvorbis”
audio_bitrate：音频比特率，字符串形式，如“50k”、“500k”、“3000k”，用于将确定输出文件中音频的大小/质量。请注意，这主要是一个指示性目标，输出文件的比特率不一定会按此设置
audio_bufsize：音频缓冲区大小
temp_audiofile：如果输出由音频，则该参数用于指定要生成并合并到电影中的临时音频文件的名称，如果没有指定则用缺省模式的临时文件名
rewrite_audio：这个参数目前没有作用，估计是为了兼容以前的版本
remove_temp：是否删除临时文件
write_logfile：如果为True，将为音频和视频输出记录日志文件。日志文件将以“.log”结尾，包含输出文件的名称
verbose：已经废弃使用，留下来是为了兼容性，以前用于打开/关闭消息。现在使用logger=None
threads：用于ffmpeg的线程数，可以加快多核计算机上视频输出的速度
ffmpeg_params：需额外传递的其他ffmpeg参数，用列表传递，形如：[‘option1’，‘value1’，’-option2’，‘value2’]
logger：字符串类型，"bar"表示进度条、None 表示不设置、或任何程序日志记录器的名字

四、小结

本文介绍了使用Python+Moviepy 三行代码实现从视频文件中提取音频的方法，并介绍了moviepy的功能及安装以及相关处理的关键函数及语法。

写博不易，敬请支持：

如果阅读本文于您有所获，敬请点赞、评论、收藏，谢谢大家的支持！

如对文章内容存在疑问，可在博客评论区留言，或关注：老猿Python 微信公号发消息咨询。

更多相关moviepy知识的介绍请参考《 Python音视频剪辑库MoviePy1.0.3中文教程导览及可执行工具下载》的导览式介绍。

关于老猿的付费专栏

付费专栏《使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程，对应文章目录为《使用PyQt开发图形界面Python应用专栏目录》；
付费专栏《 moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理，对应文章目录为《moviepy音视频开发专栏文章目录》；
付费专栏《 OpenCV-Python初学者疑难问题集》为《 OpenCV-Python图形图像处理》的伴生专栏，是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合，相关资料基本上都是老猿反复研究的成果，有助于OpenCV-Python初学者比较深入地理解OpenCV，对应文章目录为《 OpenCV-Python初学者疑难问题集专栏目录》
付费专栏《Python爬虫入门》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容，包括爬虫入门的基础知识，以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

前两个专栏都适合有一定Python基础但无相关知识的小白读者学习，第三个专栏请大家结合《 OpenCV-Python图形图像处理》的学习使用。

对于缺乏Python基础的同仁，可以通过老猿的免费专栏《专栏：Python基础教程目录》从零开始学习Python。

如果有兴趣也愿意支持老猿的读者，欢迎购买付费专栏。

如对文章内容存在疑问，可在博客评论区留言，或关注：老猿Python 微信公号发消息咨询。

老猿Python，跟老猿学Python！

☞ ░ 前往老猿Python博文目录 ░

以上是关于Python3，早知道3行代码就能提取音频，我把这10块钱买包子吃不香吗？的主要内容，如果未能解决你的问题，请参考以下文章

自学编程的5大误区，早知道早避坑，过来人的宝贵经验

Python3 批量提取视频中的音频

Python3，19行代码，我把她的照片写入到Excel中，2022年伊始，她终于被我感动了。

NLP见证 | 原来可以这样教育孩子，早知道就没这么多遗憾了！