音频压缩编码技术—有损压缩

Posted 2021-07-25 赵新政

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了音频压缩编码技术—有损压缩相关的知识，希望对你有一定的参考价值。

有损：压缩之后无法还原，即为有损；保证不失真情况下尽可能压缩

1 音频压缩关注点：

1.1 消除冗余信息，比如20hz-20000hz之间，才是人敏感区域，其他音频需要过滤掉。
1.2 冗余信息定义：人听觉范围之外，以及遮蔽信息的剔除

2.1 频域遮蔽：
在这里插入图片描述
环境音+各类人声音，如何凸显有用信息，遮蔽无效信息呢？
利用傅里叶变换等，将时域信息转化为频域信息，众多的波形之中，留下来需要的波形即可，比如上图：0.02khz-20khz

a. 声音强度的静音门槛，本条曲线意味着根据不同的频率，最少到达所少dB的声音强度，人类才能听到，本强度之下的声音都可以消除掉。
b. 遮罩门槛，是指在某个频域范围内，找到最大dB的音源，做一个钟形曲线，在曲线之上的才能被留下，其他的就干掉，因为这些频率距离最高分贝者太近了，所以才会被遮蔽。

感性理解：频率很低或者很高，都需要较大的声音人耳才能识别，中间的频段就可以声音没这么大，这也就解释了静音门槛；相似接近的频率者在一起，就需要互相之间对比，才能知道凸显哪一个。

2.2 时域遮蔽：
在这里插入图片描述
距离最大声音越近，不管前后，都会被屏蔽曲线屏蔽掉，因为你离我最大声音太近了，所以会按照曲线来被屏蔽

以上是关于音频压缩编码技术—有损压缩的主要内容，如果未能解决你的问题，请参考以下文章