在 ffmpeg 中添加静音音频

Posted

技术标签:

【中文标题】在 ffmpeg 中添加静音音频【英文标题】:adding silent audio in ffmpeg 【发布时间】:2012-09-04 06:59:38 【问题描述】:

我正在尝试使用 ffmpeg 将静音音轨添加到 MOV 文件。

我创建了一个比视频更长的无声音轨,并打算在 ffmpeg 中使用 -shortest 选项。

使用 SoX v14.3.1,我运行它来生成一个 wav 文件:

sox -n -r 44100 -b 16 -c 2 -L silence.wav trim 0.0 60.000

# -n  = Sox's null file
# -r = sample rate 
# -b = bits per sample
# -c = num of channels
# -L = little endian
# filename
# trim - is an effect, args start and length.

我的基本 ffmpeg 命令如下所示:

ffmpeg -shortest \
-i silence.wav -acodec pcm_s16le \
-i vid_no_sound.mov -vcodec copy vid_with_sound.mov

这样的结果是:

ffmpeg version 0.11.1 Copyright (c) 2000-2012 the FFmpeg developers
  built on Aug 27 2012 13:11:25 with gcc 4.4.5
  configuration: --extra-cflags=-static --prefix=/root/ffmpeg_build/src/ffmpeg-0.11.1 --enable-bzlib --enable-gnutls --enable-libfreetype --enable-libmp3lame --enable-libdc1394 --enable-libpulse --enable-librtmp --enable-libschroedinger --enable-libtheora --enable-libvorbis --enable-libx264 --enable-libxvid --enable-openssl --enable-zlib --enable-gpl --enable-nonfree --enable-version3
  libavutil      51. 54.100 / 51. 54.100
  libavcodec     54. 23.100 / 54. 23.100
  libavformat    54.  6.100 / 54.  6.100
  libavdevice    54.  0.100 / 54.  0.100
  libavfilter     2. 77.100 /  2. 77.100
  libswscale      2.  1.100 /  2.  1.100
  libswresample   0. 15.100 /  0. 15.100
  libpostproc    52.  0.100 / 52.  0.100
[wav @ 0x29ab2e0] max_analyze_duration 5000000 reached at 5015510
Guessed Channel Layout for  Input Stream #0.0 : stereo
Input #0, wav, from 'silence.wav':
  Duration: 00:01:00.00, bitrate: 1411 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, stereo, s16, 1411 kb/s
Input #1, mov,mp4,m4a,3gp,3g2,mj2, from 'vid_no_sound.mov':
  Metadata:
    major_brand     : qt
    minor_version   : 537199360
    compatible_brands: qt
    creation_time   : 2012-07-25 13:41:44
  Duration: 00:00:14.50, start: 0.000000, bitrate: 27457 kb/s
    Stream #1:0(eng): Video: qtrle (rle  / 0x20656C72), rgb24, 1920x1080, 27450 kb/s, SAR 1920:1920 DAR 16:9, 24 fps, 24 tbr, 24 tbn, 24 tbc
    Metadata:
      creation_time   : 2012-07-25 13:41:44
      handler_name    : Apple Alias Data Handler
    Stream #1:1(eng): Data: none (tmcd / 0x64636D74)
    Metadata:
      creation_time   : 2012-07-25 13:42:06
      handler_name    : Apple Alias Data Handler
      timecode        : 00:00:00:00
File 'vid_with_sound.mov' already exists. Overwrite ? [y/N] y
auto-inserting filter 'auto-inserted resampler 0' between the filter 'src' and the filter 'aformat'
[aresample @ 0x2ab3b00] chl:stereo fmt:s16 r:44100Hz -> chl:stereo fmt:flt r:44100Hz
[NULL @ 0x2994320] Codec is experimental but experimental codecs are not enabled, try -strict -2
Output #0, mov, to 'vid_with_sound.mov':
    Stream #0:0(eng): Video: qtrle (rle  / 0x20656C72), rgb24, 1920x1080 [SAR 1920:1920 DAR 16:9], q=2-31, 27450 kb/s, 24 fps, 90k tbn, 24 tbc
    Metadata:
      creation_time   : 2012-07-25 13:41:44
      handler_name    : Apple Alias Data Handler
    Stream #0:1: Audio: none, 44100 Hz, stereo, flt, 128 kb/s
Stream mapping:
  Stream #1:0 -> #0:0 (copy)
  Stream #0:0 -> #0:1 (pcm_s16le -> aac)
Error while opening encoder for output stream #0:1 - maybe incorrect parameters such as bit_rate, rate, width or height

我已尝试按照建议添加-strict -2,尽管我不确定将其放在命令行中的哪个位置。

我花了两个小时尝试不同的东西并阅读 ffmpeg 文档,但我仍然卡住了。

如何将静音音轨添加到 mov 文件?

【问题讨论】:

【参考方案1】:

订单很重要。我已经尝试了上面的 sox 命令和下面的 ffmpeg 命令,它可以工作

ffmpeg -shortest -i silence.wav -acodec pcm_s16le -i out.mov -vcodec copy -strict -2 vid_with_sound.mov

【讨论】:

顺序在哪里很重要——什么是错误的顺序以及它会导致什么问题? ffmpeg 命令行参数顺序很重要。否则它将无法正常工作【参考方案2】:

anullsrc音频过滤器

您可以使用ffmpeg 创建无声音频,并一步将其与视频结合。此示例将使用anullsrc audio filter 生成采样率为 44100 的立体声静音音频:

ffmpeg -f lavfi -i anullsrc=channel_layout=stereo:sample_rate=44100 -i video.mov -c:v copy -c:a aac -shortest output.mov
channel_layout=stereo:sample_rate=44100 是默认值,但我将其作为如何使用这些选项的示例。

忽略现有音频

如果您的视频输入文件包含您想要忽略的音频,则使用-map 选项覆盖默认的stream selection 行为:

ffmpeg -f lavfi -i anullsrc -i video.mov -c:v copy -c:a aac -map 0:a -map 1:v -shortest output.mp4
-map 0:a -map 1:v 可以翻译为:从第一个输入 (0) 使用音频 (a),从第二个输入 (1) 使用视频 (v)。

注意事项

这些示例将 stream copy 视频,因此它不会被重新编码(如“复制和粘贴”)。

始终建议使用最近的ffmpeg。最新版本的链接在 FFmpeg Download 页面上,或者您可以参考一步一步的 guide to compile ffmpeg

【讨论】:

/dev/zero 也适用于 avconv,但 -f lavfi 似乎没有。不要忘记-shortest 标志,否则它将永远坐在那里编码沉默。 如果我只想在音频不可用的地方添加静音,那该怎么办?例如录制桌面音频时? @Ahmad 抱歉,我不明白你的问题。 @LordNeckbeard 我是说我正在从 virtual-audio-capturer 录制桌面音频,当桌面产生一些声音时它会开始桌面录制,所以当声音不是来自桌面时,是否可以创建静音声音或任何在录制过程中一直创建静音音频的方法并同时录制桌面 从原始帖子中不是很清楚,但似乎说“我创建了一个比视频更长的无声音轨”,他们的意思是他们想在现有电影的末尾添加一些无声。这正是我在保持最后一部电影帧不变的同时寻找的东西。那么你将如何附加 2 秒使现有的 .MP4 静音?谢谢。【参考方案3】:

这是latest ffmpeg 的命令,适用于 MP4 (H264/AVC):

ffmpeg -f lavfi -i aevalsrc=0 -i input.mp4 -c:v copy -c:a aac -map 0 -map 1:v -shortest output.mp4

【讨论】:

如果我想在音频不可用的情况下添加静音音频怎么办?【参考方案4】:

从图像创建视频或将图像转换为视频,然后使用 ffmpeg 添加静音音频。

您可以在 ffmpeg 中使用 anullsrc 音频源过滤器。从图像制作 5.1 通道、48000 Hz 采样率、10 秒无声视频文件的示例:

ffmpeg -loop 1 -i img002.jpg -f lavfi -i anullsrc=channel_layout=5.1:sample_rate=48000 -t 10 -c:v libx264 -t 10 -pix_fmt yuv420p -vf scale=480:320 -y output.mp4

img002.jpg:输入图片文件

-i anullsrc: 添加静音音频

-t 10:秒数

scale=480:320:视频分辨率宽度=420,高度=320

-y:覆盖现有的输出文件

output.mp4:输出文件

【讨论】:

有没有办法在 filter_complex 中为中间输出做到这一点? @ed22 是的,当然! anullsrc 可用于 filter_complex 链。 -filter_complex "... anullsrc=cl=mono:r=44100[silence] ..."我相信这就是你要找的? 这是我尝试过的一个示例用法:ffmpeg -i input.mp4 -filter_complex "[0:v]scale=1920:1080[video_out]; anullsrc=cl=mono:r=44100[audio_out]" -map [video_out] -map [audio_out] -shortest output.mp4

以上是关于在 ffmpeg 中添加静音音频的主要内容,如果未能解决你的问题,请参考以下文章

FFmpeg 检查音频通道是不是静音

使用带有silencedetect的FFMPEG来消除音频静音

使用ffmpeg 操作音频文件前后部分静音移除.

如何通过静音部分分割视频或音频

AVFoundation 添加音频输入使音频播放静音

[Python][Moviepy] 如何在音频末尾添加短暂的静音?