音频知识详解
Posted linuxandmcu
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音频知识详解相关的知识,希望对你有一定的参考价值。
引言
现实生活中,我们听到的声音都是时间连续的,我们称为这种信号叫模拟信号
。模拟信号需要进行数字化以后才能在计算机中使用。
目前我们在计算机上进行音频播放都需要依赖于音频文件。音频文件
的生成过程是将声音信息采样
、量化
和编码
产生的数字信号的过程,人耳所能听到的声音,最低的频率是从 20Hz 起一直到最高频率 20KHZ,因此音频文件格式的最大带宽是 20KHZ。根据奈奎斯特的理论,只有采样频率
高于声音信号最高频率
的两倍时,才能把数字信号表示的声音还原成为原来的声音,所以音频文件的采样率一般在 40~50K HZ,比如最常见的 CD 音质采样率 44.1KHZ。
音频基本概念
采样:波是无限光滑的,采样的过程就是从波中抽取某些点的频率值,就是把模拟信号数字化。如下图所示:
注:蓝色代表模拟音频信号,红色代表采样得到的量化数值。
采样频率:单位时间内对模拟信号的采样次数。采样频率越高,声音的还原就越真实越自然,当然数据量就越大。采样频率一般共分为 22.05KHz、44.1KHz、48KHz 三个等级。8KHz - 电话所用采样率, 对于人的说话已经足够,22.05KHz 只能达到 FM 广播的声音品质(适用于语音和中等品质的音乐),44.1KHz 则是是最常见的采样率标准,理论上的 CD 音质界限,48KHz 则更加精确一些(对于高于 48KHz 的采样频率人耳已无法辨别出来了,所以在电脑上没有多少使用价值)。
采样位数(也成量化级、样本尺寸、量化数据位数):每个采样点能够表示的数据范围。采样位数通常有 8bits 或 16bits 两种,采样位数越大,所能记录声音的变化度就越细腻,相应的数据量就越大。8 位字长量化(低品质)和 16 位字长量化(高品质),16 bit 是最常见的采样精度。
量化:将采样后离散信号的幅度用二进制数表示出来的过程称为量化。(日常生活所说的量化,就是设定一个范围或者区间,然后看获取到的数据在这个条件内的收集出来)。
PCM: PCM(Pulse Code Modulation),即脉冲编码调制,对声音进行采样、量化过程,未经过任何编码和压缩处理。
编码:采样和量化后的信号还不是数字信号,需要将它转化为数字编码脉冲,这一过程称为编码。模拟音频进采样、量化和编码后形成的二进制序列就是数字音频信号。
声道数:声道数是指支持能不同发声的音响的个数,它是衡量音响设备的重要指标之一。
码率:(也成位速、比特率)是指在一个数据流中每秒钟能通过的信息量,代表了压缩质量。比如 MP3 常用码率有 128kbit/s、160kbit/s、320kbit/s 等等,越高代表着声音音质越好。MP3 中的数据有 D3 和音频数据组成,ID3 用于存储歌名、演唱者、专辑、音轨等我们可以常见的信息。
音频帧:音频数据是流式的,本身没有明确的一帧帧的概念,在实际的应用中,为了音频算法处理/传输的方便,一般约定俗成取 2.5ms~60ms 为单位的数据量为一帧音频。这个时间被称之为 “采样时间”,其长度没有特别的标准,它是根据编解码器和具体应用的需求来决定的。
以上是关于音频知识详解的主要内容,如果未能解决你的问题,请参考以下文章