音频知识详解

Posted linuxandmcu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音频知识详解相关的知识,希望对你有一定的参考价值。

引言

现实生活中,我们听到的声音都是时间连续的,我们称为这种信号叫模拟信号。模拟信号需要进行数字化以后才能在计算机中使用。

目前我们在计算机上进行音频播放都需要依赖于音频文件音频文件的生成过程是将声音信息采样量化编码产生的数字信号的过程,人耳所能听到的声音,最低的频率是从 20Hz 起一直到最高频率 20KHZ,因此音频文件格式的最大带宽是 20KHZ。根据奈奎斯特的理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音,所以音频文件的采样率一般在 40~50K HZ,比如最常见的 CD 音质采样率 44.1KHZ。


音频基本概念

采样:波是无限光滑的,采样的过程就是从波中抽取某些点的频率值,就是把模拟信号数字化。如下图所示:

技术图片


注:蓝色代表模拟音频信号,红色代表采样得到的量化数值。

采样频率:单位时间内对模拟信号的采样次数。采样频率越高,声音的还原就越真实越自然,当然数据量就越大。采样频率一般共分为 22.05KHz、44.1KHz、48KHz 三个等级。8KHz - 电话所用采样率, 对于人的说话已经足够,22.05KHz 只能达到 FM 广播的声音品质(适用于语音和中等品质的音乐),44.1KHz 则是是最常见的采样率标准,理论上的 CD 音质界限,48KHz 则更加精确一些(对于高于 48KHz 的采样频率人耳已无法辨别出来了,所以在电脑上没有多少使用价值)。

采样位数(也成量化级、样本尺寸、量化数据位数):每个采样点能够表示的数据范围。采样位数通常有 8bits 或 16bits 两种,采样位数越大,所能记录声音的变化度就越细腻,相应的数据量就越大。8 位字长量化(低品质)和 16 位字长量化(高品质),16 bit 是最常见的采样精度。

量化:将采样后离散信号的幅度用二进制数表示出来的过程称为量化。(日常生活所说的量化,就是设定一个范围或者区间,然后看获取到的数据在这个条件内的收集出来)。

PCM: PCM(Pulse Code Modulation),即脉冲编码调制,对声音进行采样、量化过程,未经过任何编码和压缩处理。

编码:采样和量化后的信号还不是数字信号,需要将它转化为数字编码脉冲,这一过程称为编码。模拟音频进采样、量化和编码后形成的二进制序列就是数字音频信号。

声道数:声道数是指支持能不同发声的音响的个数,它是衡量音响设备的重要指标之一。

码率:(也成位速、比特率)是指在一个数据流中每秒钟能通过的信息量,代表了压缩质量。比如 MP3 常用码率有 128kbit/s、160kbit/s、320kbit/s 等等,越高代表着声音音质越好。MP3 中的数据有 D3 和音频数据组成,ID3 用于存储歌名、演唱者、专辑、音轨等我们可以常见的信息。

音频帧:音频数据是流式的,本身没有明确的一帧帧的概念,在实际的应用中,为了音频算法处理/传输的方便,一般约定俗成取 2.5ms~60ms 为单位的数据量为一帧音频。这个时间被称之为 “采样时间”,其长度没有特别的标准,它是根据编解码器和具体应用的需求来决定的。


音频知识详解(一)


以上是关于音频知识详解的主要内容,如果未能解决你的问题,请参考以下文章

Audio音频开发音频基础知识及PCM技术详解

Audio音频开发音频基础知识及PCM技术详解

关于在各浏览器中插入音频文件的html代码片段

详解如何使用代码进行音频合成

详解如何使用代码进行音频合成

详解如何使用代码进行音频合成