基于ffmpeg开发的多音频文件音量均衡程序

Posted Love丶伊卡洛斯

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于ffmpeg开发的多音频文件音量均衡程序相关的知识,希望对你有一定的参考价值。

前言

audio_balance

✨ 基于ffmpeg开发的多音频文件音量均衡程序 ✨

项目地址

GitHub:https://github.com/Ikaros-521/audio_balance
gitee:https://gitee.com/ikaros-521/audio_balance

使用说明

Python:3.9+
程序依赖 ffmpeg实现。请先安装ffmpeg并配置到环境变量后使用。(官方仓库:https://github.com/FFmpeg/FFmpeg
如果你本地装了格式工厂,可以直接把格式工厂安装路径配置到环境变量path中(格式工厂自带ffmpeg)
注意:使用时请清空 out文件夹(即输出音频的文件夹)

使用参考

1、获取期待音量分贝

使用 get_mean_volume.py 获取音频文件平均音量。此处建议传入你认为合适音量的音频文件获取信息,以做为基准。

# 打开cmd,在工程路径下运行以下命令,其中 data/origin.mp3 为需要解析的音频文件
python get_mean_volume.py data/origin.mp3

命令执行返回关键内容截取

[Parsed_volumedetect_0 @ 000001d73eb72840] n_samples: 5329246
[Parsed_volumedetect_0 @ 000001d73eb72840] mean_volume: -20.7 dB
[Parsed_volumedetect_0 @ 000001d73eb72840] max_volume: -2.0 dB
[Parsed_volumedetect_0 @ 000001d73eb72840] histogram_2db: 57
[Parsed_volumedetect_0 @ 000001d73eb72840] histogram_3db: 390
[Parsed_volumedetect_0 @ 000001d73eb72840] histogram_4db: 1226
[Parsed_volumedetect_0 @ 000001d73eb72840] histogram_5db: 3330
[Parsed_volumedetect_0 @ 000001d73eb72840] histogram_6db: 6770
id3v2_parse

data/origin.mp3 平均音量:-20.7dB

2、执行多音频均衡

在步骤1中我们看到 data\\origin.mp3的mean_volume(平均音量)为 -20.7dB,我们期望音量为 -10dB。

# 打开cmd,在工程路径下运行以下命令
# 请依次传入 目标平均音量(默认-10dB,做为基准,实际不会调至此) 待处理音频路径(默认data\\) 输出音频路径(默认out\\)
python audio_balance.py -10 data\\ out\\

运行完毕后输出内容

待处理音频路径:data\\
输出音频路径:out\\
目标平均音量:-10.0dB
待处理音频文件总数:4
out\\data\\1 创建成功
data\\1\\origin.mp3 平均音量:-20.7dB
ffmpeg -i data\\1\\origin.mp3 -filter:a "volume=10.7dB" out\\data\\1\\origin.mp3
转换完毕,输出至:out\\data\\1\\origin.mp3
data\\high.mp3 平均音量:-11.1dB
ffmpeg -i data\\high.mp3 -filter:a "volume=1.1dB" out\\data\\high.mp3
转换完毕,输出至:out\\data\\high.mp3
data\\low.mp3 平均音量:-30.7dB
ffmpeg -i data\\low.mp3 -filter:a "volume=20.7dB" out\\data\\low.mp3
转换完毕,输出至:out\\data\\low.mp3
data\\origin.mp3 平均音量:-20.7dB
ffmpeg -i data\\origin.mp3 -filter:a "volume=10.7dB" out\\data\\origin.mp3
转换完毕,输出至:out\\data\\origin.mp3
运行完毕
请按任意键继续. . .`

然后可以使用 get_mean_volume.py 再获取下输出文件的平均音量查看情况

3、批量查看文件夹下音频信息(平均音量等)

在步骤1中我们只看了一个,如果你觉得看起来有点慢,基准文件需要批量参考,可以使用这个命令

# 打开cmd,在工程路径下运行以下命令
# 请传入 需要获取平均音量的音频文件夹路径 是否只显示平均音量(是1 否0)
python get_mean_volume_plus.py data\\ 1

输出内容

文件夹路径:data\\
音频文件总数:4
data\\1\\origin.mp3 平均音量:-20.7dB
data\\high.mp3 平均音量:-11.1dB
data\\low.mp3 平均音量:-30.7dB
data\\origin.mp3 平均音量:-20.7dB

参考文档

思路参考:https://wenku.baidu.com/view/ac883e43986648d7c1c708a1284ac850ad02042e.html?wkts=1668941587940&bdQuery=python%E8%8E%B7%E5%8F%96%E9%9F%B3%E9%A2%91%E9%9F%B3%E9%87%8F%E5%A4%A7%E5%B0%8F
ffmpeg参考:https://blog.csdn.net/ternence_hsu/article/details/91407681
遍历文件参考:https://blog.csdn.net/weixin_41521681/article/details/92768157

以上是关于基于ffmpeg开发的多音频文件音量均衡程序的主要内容,如果未能解决你的问题,请参考以下文章

基于ffmpeg开发的多音频文件音量均衡程序

FFMPEG调整音频文件音量大小

使用 FFMPEG 仅更改其中一个音频通道的音量

FFmpeg:如何在音频文件中间降低几秒钟的音量? [复制]

使用 ffmpeg 更改要与视频合并的音频文件的音量

使用 FFmpeg 或 OpenAL 的音频均衡器