音频_音频认知(3.音频采样)

Posted rainpaint

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音频_音频认知(3.音频采样)相关的知识,希望对你有一定的参考价值。

音频采样

首先我们先了解一下过去和现在的音频录制原理

磁带录制与播放原理

录音: 话筒将接收到声音的波动大小转化成对应强弱的电流,通过蹄形磁铁,产生相应的磁性,

  磁铁下有匀速通过空隙的磁带,上面带有磁粉,磁粉受到不同磁性强度的影响,会聚集在不同的位置,以此来实现对声音的记录.

播音: 上述过程逆向转换,实现声音的播放

技术图片

 

 

 

音频数字化

数字化音频技术是将模拟信号进行数字编码(AD转换)后进行压缩、储存、编辑、传输等过程,

最终经数模转换器再转换成模拟信号(DA转换),经均衡、放大后输出到扬声系统。

音频数字化优点:

1、数字音频传输过程中仅仅是编码的传输和转换,音频信号无损耗,与模拟技术相比,低失真、频响宽、动态好、信噪比高,可达到容更理想的Hi-Fi效果.

2、数字化音频技术“能方便进行储存、编辑、传输等工作.

简言之:小体积,大存储,低失真,高传输.

音频的数字化采集与存储

采样,指把时间域或空间域的连续量转化成离散量的过程 。

对声音的采样常用麦克风等设备将声音信号转换成电信号,再用模/数转换器将电信号转换成一串用1和0表示的二进制数字(数字信号)。

我们每秒对声音采样上万次,获得上万个按照时间顺序排列的二进制数字。于是,我们就将连续变化不断的声音转化成了计算机可储存并识别的二进制数字。

 

技术图片

 

 

 

 

如windows的关机音效: 该声音由84700个不同的数字组成。 其中的一段数字如下:(二进制数字已转换为十进制)

… 413, 263, 137, 15, -124, -253, -369, -463, -511, -545, -587, -632, -678, -701, -687, -659, -623, -579, -539, -473, -380, -282, -162, -35, 78, 211, 341, 430, 499, 548, 551, …

 

如果用图像的形式表示该音频,则图像如下:

(横轴是时间,纵轴为振幅,两个图像分别代表左右声道。由于声音频率较大,所以在图像中的信号不是“正弦”,而是实心的。)

技术图片

 

 

 

采样频率:

采样频率指录音设备在一秒钟内对声音信号的采样次数。采样频率越高,声音的还原就越真实越自然。

技术图片

 

 

量化位数:

我们不可能获得所有时间下声音的强度,因此声音是等时间间隔、离散采样的。

同样,采样获得的数据不可能无限的精确,如数字为63.2222222….,这无法在计算机中储存。

因此,采样获得的数据同样也是离散的。 量化位数是音频文件的另一个参数。量化位数越大,声音的质量越高。常用的量化位数有8位、16位和32位

 

量化位数指用几位二进制数来存储采样获得的数据。量化位数为8即指用8位二进制数来存储数据,如00010111

例:

 

有一段正弦声波,假设量化位数为3,即存储的数据只有000/001/010/011/100/101/110/111 这8种可能 即:2^3 = 8;(同理:2^8 = 256;2^16 = 65 536; 2^32 = 4 294 967 296;)

技术图片

 

 技术图片

 

 

 

另外值得注意的是,不同量化位数存储的数据不可直接比较。

如4位量化位数存储的1111,其十进制是15,8位量化位数存储的10000000,其十进制是64。不是因为64>15,所以后者对应的声音比前者大。而是应该二者分别除以其总取值范围后在比较。

技术图片

 

 可见:前者对应的声音比后大

 

以上是关于音频_音频认知(3.音频采样)的主要内容,如果未能解决你的问题,请参考以下文章

音频合并,剪切,降采样,时长等处理

音频重采样

如何重新采样音频?

音频重采样实现原理

使用SampleRateConverter对音频采样率进行转换

ffmpeg 限制音频采样率