简单几招教你玩转音视频 DIY

Posted 2022-05-03 Data-Mining

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了简单几招教你玩转音视频 DIY相关的知识，希望对你有一定的参考价值。

前言

很多时候，大家都会想自己操作一下身边的音频文件和视频文件，当有这个想法时，大概率会想到使用各种剪辑工具。那我们有没有别的更加简单的选择呢？必须的，今天就来带大家掌握一门新的技术，可以只要视频文件中的音频或者视频，还有任意组合两个音频和视频文件。

正文

一、概念解惑

1. 视频

日常生活中，我们通常所说的视频文件其实包括视频和音频两部分，再直白一点的说法就是画面和声音两部分，常见的视频文件有 mp4、flv、avi、rmvb 等。

2. 音频

日常生活中，常说的音频文件就是纯音频文件，比如常见的 mp3、aac 等。

3. 工具

查看视频文件媒体信息的工具，一般用 ffprobe 或者 mediaInfo，前者是命令行工具，后者带有图形用户界面，比较适合入门选手和小白同学使用。

mediaInfo 的使用方式也非常简单，只需要把视频文件拖拽到界面窗口中，程序就会自动列出视频文件中所包含的视频和音频的媒体信息。下面演示一下 mediaInfo 的使用效果，首先看一下视频源文件，非常经典的《大雄兔》：

查看效果如下图所示：

从上图可以非常清晰的看到该视频文件中包含 AVC 编码的视频和 AAC 编码的音频，其中，AVC 和 AAC 分别是一种视频和音频的编码格式。接下来的实验都将围绕这段视频文件进行展开，另外还有一个工具，也是本文的主角——ffmpeg，接下来的实验都将使用到它。

二、音视频 DIY

1. 原始视频文件

在开始今天的演示之前，我们先来看一下即将用于实验的视频源文件的样子，请往上翻，是的，就是刚才介绍的《大雄兔》视频。

2. 单独抽离音频

如何从视频文件中单独抽离出音频呢？如果使用 ffmpeg 的话，会非常简单。假设，我们想要把视频文件中的音频数据抽离出来保存到 onlyaudio 的音频文件中，只需执行如下命令：

ffmpeg -i big_buck_bunny.mp4 onlyaudio.aac -y

执行结果如下图所示：

使用 mediaInfo 查看目标文件 onlyaudio.aac 的媒体信息：

从上图可以看出目标文件 onlyaudio.aac 中只包含音频信息。这个音频文件是可以直接播放的，就像 mp3 一样，常用的播放器都支持。划重点：如果一个MV文件太大，自己又只想要其中的音乐，那么这个方法就派上用场啦，哈哈😄

现在已经实现了只要音频数据，那如何实现只要视频数据呢？请看下文。

3. 单独抽离视频

如何从视频文件中单独抽离出视频呢？如果使用 ffmpeg 的话，也非常简单。假设，我们想要把视频文件中的视频数据抽离出来保存到 onlyvideo 的视频文件中，只需执行如下命令：

ffmpeg -i big_buck_bunny.mp4 -an onlyvideo.mp4 -y

执行结果如下图所示：

使用 mediaInfo 查看目标文件 onlyvideo.mp4 的媒体信息：

从上图可以看出目标文件 onlyvideo.mp4 中只包含视频信息。我们播放这个视频文件时，会发现是没有声音的。 划重点：现实生活中，如果我们只想把视频画面保存下来，不想要背景声音，这就是一个很好的处理方法。

已经实现了视频和音频数据的分离，那能实现二者的组合吗？答案是可以，请看下文。

4. 任意组合音频和视频文件

如何实现纯音频和纯视频文件的组合呢？同样也要用到本文的神兵利器——ffmpeg。接下来准备素材：纯视频素材就用上文的 onlyvideo.mp4 文件，纯音频素材我们换一个，用我非常喜欢的音乐——《少年》（不忘初心，永远做那个逐风少年）。

执行 ffmpeg 命令如下：

ffmpeg -i onlyvideo.mp4 -i 少年.mp3 combine.mp4 -y

执行结果如下：

Output #0, mp4, to 'combine.mp4':
Metadata:
major_brand : isom
minor_version : 512
compatible_brands: isomiso2mp41
encoder : Lavf57.25.100
Stream #0:0(eng): Video: mpeg4 ( [0][0][0] / 0x0020), yuv420p, 640x360 [SAR 1:1 DAR 16:9], q=2-31, 200 kb/s, 24 fps, 12288 tbn, 24 tbc (default)
Metadata:
handler_name : VideoHandler
encoder : Lavc57.24.102 mpeg4
Side data:
unknown side data type 10 (24 bytes)
Stream #0:1: Audio: aac (LC) ([64][0][0][0] / 0x0040), 44100 Hz, stereo, fltp, 128 kb/s
Metadata:
encoder : Lavc57.24.102 aac
Stream mapping:
Stream #0:0 -> #0:0 (mpeg4 (native) -> mpeg4 (native))
Stream #1:0 -> #0:1 (mp3 (native) -> aac (native))
Press [q] to stop, [?] for help
frame= 137 fps=0.0 q=21.6 size= 363kB time=00:00:05.71 bitrate= 520.0kbits/frame= 397 fps=397 q=22.3 size= 868kB time=00:00:16.54 bitrate= 429.8kbits/frame= 686 fps=457 q=16.1 size= 1385kB time=00:00:28.58 bitrate= 397.0kbits/frame= 963 fps=481 q=21.8 size= 1852kB time=00:00:40.12 bitrate= 378.0kbits/frame= 1267 fps=507 q=19.3 size= 2384kB time=00:00:52.79 bitrate= 369.9kbits/frame= 1442 fps=480 q=14.2 size= 2652kB time=00:01:08.91 bitrate= 315.2kbits/frame= 1442 fps=412 q=14.2 size= 2945kB time=00:01:28.58 bitrate= 272.3kbits/frame= 1442 fps=360 q=14.2 size= 3224kB time=00:01:46.23 bitrate= 248.6kbits/frame= 1442 fps=320 q=14.2 size= 3515kB time=00:02:04.41 bitrate= 231.4kbits/frame= 1442 fps=288 q=14.2 size= 3829kB time=00:02:24.35 bitrate= 217.3kbits/frame= 1442 fps=262 q=14.2 size= 4148kB time=00:02:44.53 bitrate= 206.5kbits/frame= 1442 fps=240 q=14.2 size= 4473kB time=00:03:05.10 bitrate= 198.0kbits/frame= 1442 fps=222 q=14.2 size= 4824kB time=00:03:27.40 bitrate= 190.6kbits/frame= 1442 fps=206 q=14.2 size= 5150kB time=00:03:48.15 bitrate= 184.9kbits/frame= 1442 fps=200 q=14.2 Lsize= 5499kB time=00:03:56.12 bitrate= 190.8kbits/s speed=32.7x
video:1703kB audio:3730kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 1.206521%
[aac @ 0x7f97cf80c200] Qavg: 509.626

使用 mediaInfo 查看目标文件 combine.mp4 的媒体信息：

从上图我们可以看到，目标文件中已经包含了《大雄兔》的视频画面和《少年》的背景音乐，此时播放该视频文件，你会发现原来的背景声音已经换成《少年》音乐。哈哈，是不是很神奇！

另外，还有一个有意思的地方，如果你足够细心的话，你就会发现原来一分钟的视频文件，和《少年》音频组合后，变成了三分钟五十六秒。这是为什么呢？因为《少年》这首音乐的时长是三分钟五十六秒，合并的过程中，ffmpeg 会默认以时长最长的文件作为目标文件的时长。此时，有小伙伴可能就会问：视频总共是一分钟的内容，那一分钟后会显示什么画面呢？答案是显示最后一帧的画面，也就是音视频领域常说的静帧画面。如果想了解更多音视频知识，可以看我相关的技术专栏。这里就不过多展开了，本文只为了让更多其他领域的小伙伴了解 ffmpeg 的常用方法。

结尾

好了，今天关于视频文件的常用操作就介绍完了，包括从视频文件中单独抽离音频数据、从视频文件中单独抽离视频数据、任意组合两个音频和视频文件。方法也非常简单，但是其中的原理却大有深意，感兴趣的小伙伴可以深入了解。能写这篇文章，需要感谢五一假期，平时工作太忙了，很少有时间安心写一篇文章。写完文章的感觉真棒，哈哈，正值五一，也祝大家劳动节快乐！

作者简介：😄大家好，我是 Data-Mining（liuzhen007），是一位典型的音视频技术爱好者，前后就职于传统广电巨头和音视频互联网公司，具有丰富的音视频直播和点播相关经验，对 WebRTC、FFmpeg 和 Electron 有非常深入的了解，😄公众号：玩转音视频。同时也是 CSDN 博客专家、华为云享专家（共创编辑）、InfoQ 签约作者，欢迎关注我分享更多干货！😄

以上是关于简单几招教你玩转音视频 DIY的主要内容，如果未能解决你的问题，请参考以下文章