音频压缩编码技术—有损压缩
Posted 赵新政
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音频压缩编码技术—有损压缩相关的知识,希望对你有一定的参考价值。
有损:压缩之后无法还原,即为有损;保证不失真情况下尽可能压缩
1 音频压缩关注点:
1.1 消除冗余信息,比如20hz-20000hz之间,才是人敏感区域,其他音频需要过滤掉。
1.2 冗余信息定义:人听觉范围之外,以及遮蔽信息的剔除
2 音频压缩剪裁与屏蔽:
2.1 频域遮蔽:
环境音+各类人声音,如何凸显有用信息,遮蔽无效信息呢?
利用傅里叶变换等,将时域信息转化为频域信息,众多的波形之中,留下来需要的波形即可,比如上图:0.02khz-20khz
a. 声音强度的静音门槛,本条曲线意味着根据不同的频率,最少到达所少dB的声音强度,人类才能听到,本强度之下的声音都可以消除掉。
b. 遮罩门槛,是指在某个频域范围内,找到最大dB的音源,做一个钟形曲线,在曲线之上的才能被留下,其他的就干掉,因为这些频率距离最高分贝者太近了,所以才会被遮蔽。
感性理解:频率很低或者很高,都需要较大的声音人耳才能识别,中间的频段就可以声音没这么大,这也就解释了静音门槛;相似接近的频率者在一起,就需要互相之间对比,才能知道凸显哪一个。
2.2 时域遮蔽:
距离最大声音越近,不管前后,都会被屏蔽曲线屏蔽掉,因为你离我最大声音太近了,所以会按照曲线来被屏蔽
以上是关于音频压缩编码技术—有损压缩的主要内容,如果未能解决你的问题,请参考以下文章
利用C++行程编码编写一款压缩软件,思路:读取,编码,解码。