音频知识详解

Posted 2020-11-24 linuxandmcu

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了音频知识详解相关的知识，希望对你有一定的参考价值。

引言

现实生活中，我们听到的声音都是时间连续的，我们称为这种信号叫模拟信号。模拟信号需要进行数字化以后才能在计算机中使用。

目前我们在计算机上进行音频播放都需要依赖于音频文件。音频文件的生成过程是将声音信息采样、量化和编码产生的数字信号的过程，人耳所能听到的声音，最低的频率是从 20Hz 起一直到最高频率 20KHZ，因此音频文件格式的最大带宽是 20KHZ。根据奈奎斯特的理论，只有采样频率高于声音信号最高频率的两倍时，才能把数字信号表示的声音还原成为原来的声音，所以音频文件的采样率一般在 40~50K HZ，比如最常见的 CD 音质采样率 44.1KHZ。

音频基本概念

采样：波是无限光滑的，采样的过程就是从波中抽取某些点的频率值，就是把模拟信号数字化。如下图所示：

技术图片

注：蓝色代表模拟音频信号，红色代表采样得到的量化数值。

采样频率：单位时间内对模拟信号的采样次数。采样频率越高，声音的还原就越真实越自然，当然数据量就越大。采样频率一般共分为 22.05KHz、44.1KHz、48KHz 三个等级。8KHz - 电话所用采样率, 对于人的说话已经足够，22.05KHz 只能达到 FM 广播的声音品质(适用于语音和中等品质的音乐)，44.1KHz 则是是最常见的采样率标准，理论上的 CD 音质界限，48KHz 则更加精确一些(对于高于 48KHz 的采样频率人耳已无法辨别出来了，所以在电脑上没有多少使用价值)。

采样位数(也成量化级、样本尺寸、量化数据位数)：每个采样点能够表示的数据范围。采样位数通常有 8bits 或 16bits 两种，采样位数越大，所能记录声音的变化度就越细腻，相应的数据量就越大。8 位字长量化（低品质）和 16 位字长量化（高品质），16 bit 是最常见的采样精度。

量化：将采样后离散信号的幅度用二进制数表示出来的过程称为量化。（日常生活所说的量化，就是设定一个范围或者区间，然后看获取到的数据在这个条件内的收集出来）。

PCM： PCM（Pulse Code Modulation），即脉冲编码调制，对声音进行采样、量化过程，未经过任何编码和压缩处理。

编码：采样和量化后的信号还不是数字信号，需要将它转化为数字编码脉冲，这一过程称为编码。模拟音频进采样、量化和编码后形成的二进制序列就是数字音频信号。

声道数：声道数是指支持能不同发声的音响的个数，它是衡量音响设备的重要指标之一。

码率：(也成位速、比特率)是指在一个数据流中每秒钟能通过的信息量，代表了压缩质量。比如 MP3 常用码率有 128kbit/s、160kbit/s、320kbit/s 等等，越高代表着声音音质越好。MP3 中的数据有 D3 和音频数据组成，ID3 用于存储歌名、演唱者、专辑、音轨等我们可以常见的信息。

音频帧：音频数据是流式的，本身没有明确的一帧帧的概念，在实际的应用中，为了音频算法处理/传输的方便，一般约定俗成取 2.5ms~60ms 为单位的数据量为一帧音频。这个时间被称之为 “采样时间”，其长度没有特别的标准，它是根据编解码器和具体应用的需求来决定的。

音频知识详解(一)

以上是关于音频知识详解的主要内容，如果未能解决你的问题，请参考以下文章

Audio音频开发音频基础知识及PCM技术详解

关于在各浏览器中插入音频文件的html代码片段

详解如何使用代码进行音频合成