如何通过静音部分分割视频或音频

Posted

技术标签:

【中文标题】如何通过静音部分分割视频或音频【英文标题】:How to split video or audio by silent parts 【发布时间】:2016-07-04 14:35:50 【问题描述】:

我需要自动按单词分割演讲视频,所以每个单词都是一个单独的视频文件。你知道有什么方法可以做到这一点吗?

我的计划是检测静音部分并将它们用作单词分隔符。但我没有找到任何工具来执行此操作,并且看起来 ffmpeg 不是正确的工具。

【问题讨论】:

【参考方案1】:

你可以先用ffmpeg来detect intervals of silence,像这样

ffmpeg -i "input.mov" -af silencedetect=noise=-30dB:d=0.5 -f null - 2> vol.txt

这将产生如下读数的控制台输出:

[silencedetect @ 00000000004b02c0] silence_start: -0.0306667
[silencedetect @ 00000000004b02c0] silence_end: 1.42767 | silence_duration: 1.45833
[silencedetect @ 00000000004b02c0] silence_start: 2.21583
[silencedetect @ 00000000004b02c0] silence_end: 2.7585 | silence_duration: 0.542667
[silencedetect @ 00000000004b02c0] silence_start: 3.1315
[silencedetect @ 00000000004b02c0] silence_end: 5.21833 | silence_duration: 2.08683
[silencedetect @ 00000000004b02c0] silence_start: 5.3895
[silencedetect @ 00000000004b02c0] silence_end: 7.84883 | silence_duration: 2.45933
[silencedetect @ 00000000004b02c0] silence_start: 8.05117
[silencedetect @ 00000000004b02c0] silence_end: 10.0953 | silence_duration: 2.04417
[silencedetect @ 00000000004b02c0] silence_start: 10.4798
[silencedetect @ 00000000004b02c0] silence_end: 12.4387 | silence_duration: 1.95883
[silencedetect @ 00000000004b02c0] silence_start: 12.6837
[silencedetect @ 00000000004b02c0] silence_end: 14.5572 | silence_duration: 1.8735
[silencedetect @ 00000000004b02c0] silence_start: 14.9843
[silencedetect @ 00000000004b02c0] silence_end: 16.5165 | silence_duration: 1.53217

然后您生成命令以从每个静音结束拆分到下一个静音开始。您可能想要添加一些句柄,例如 250 毫秒,因此音频的持续时间将增加 250 毫秒 * 2。

ffmpeg -ss <silence_end - 0.25> -t <next_silence_start - silence_end + 2 * 0.25> -i input.mov word-N.mov

(我已跳过指定音频/视频参数)

您需要编写一个脚本来抓取控制台日志并生成带有时间码的结构化(可能是 CSV)文件 - 每行一对:silence_end 和下一个 quiet_start。然后是另一个脚本来生成带有每对数字的命令。

【讨论】:

作为oneliner:ffmpeg -i input.mkv -filter_complex "[0:a]silencedetect=n=-90dB:d=0.3[outa]" -map [outa] -f s16le -y /dev/null |&amp; F='-aq 70 -v warning' perl -ne 'INIT $ss=0; $se=0; if (/silence_start: (\S+)/) $ss=$1; $ctr+=1; printf "ffmpeg -nostdin -i input.mkv -ss %f -t %f $ENVF -y %03d.mkv\n", $se, ($ss-$se), $ctr; if (/silence_end: (\S+)/) $se=$1; END printf "ffmpeg -nostdin -i input.mkv -ss %f $ENVF -y %03d.mkv\n", $se, $ctr+1; ' | bash -x @JohnSmith,Mac 默认有旧的(4 之前的)bash。将|&amp; 替换为2&gt;&amp;1 | @giacecco 要跳过重新编码,请将 -c copy 添加到最后一个 ffmpeg 命令行。其他效果需要更复杂的脚本。也许有一天我会实现它并作为答案发布...... 如何调整噪声参数,noise=-30dB:d=0.5 ?我尝试了不同的值,但我没有得到 silent_start silent_end 对,也就是说,有时缺少一个。 @Vi。看来你回答这个问题可以赚100分***.com/questions/55057778/…请看一下。

以上是关于如何通过静音部分分割视频或音频的主要内容,如果未能解决你的问题,请参考以下文章

在 iOS 上捕获/分割视频并通过 HLS 重新加入会导致音频丢失

如何在有静音的地方批量拆分音频文件?

如何使来自 UIWebView 的音频静音

分割音频信号

如何在 iPod 仍在播放音频时将 iOS 上的视频静音?

自动分割mp3等音频视频文件的脚本