MP3格式音频文件结构解析

Posted 2020-10-10

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了MP3格式音频文件结构解析相关的知识，希望对你有一定的参考价值。

MP3的全称是MPEG Audio Layer3,它是一种高效的计算机音频编码方案,它以较大的压缩比将音频文件转换成较小的扩展名为.MP3的文件,基本保持原文件的音质。MP3是ISO/MPEG标准的一部分,ISO/MPEG标准描述了使用高性能感知编码方案的音频压缩,此标准一直在不断更新以满足“质高量小”的追求,现已形成MPEGLayer1、Layer2、Layer3三个音频编码解码方案。MPEGLayer3压缩率可达1:10至1:12,1M的MP3文件可播放1分钟,而1分钟CD音质的WAV文件(44100Hz,16bit,双声道,60秒)要占用10M空间,这样算来,一张650M的MP3光盘播放时间应在10小时以上,而同样容量的一张CD盘播放时间在70分钟左右。MP3的优势是CD难以比拟的。

MPEG Audio 标准

MPEG(MovingPictureExpertsGroup)是ISO下的一个动态图像专家组,它制定的MPEG标准广泛应用于各种多媒体中。 MPEG标准包括视频和音频标准,其中音频标准已制定出MPEG-1、MPEG-2、MPEG-2AAC和MPEG-4。

MPEG-1和MPEG-2标准使用同一个音频编码解码族—Layer1、2、3。MPEG-2一个新特点是采用低采样率扩展降低数据流量,另一特点是多通道扩展,将主声道增加为5个。MPEG-2AAC(MPEG-2AdvancedAudioCoding)标准是FraunhoferIIS 同AT&T公司于1997年推出的,旨在显著减少数据流量,MPEG22AAC采用的修正的离散余弦变换(MDCT,ModifiedDiscreteCo2sineTransform)算法,采样率可在8KHz到96KHz之间,声道数可在1-48之间。

MPEG Audio Layer1、2、3三个层使用相同的滤波器组、位流结构和头信息,采样频率为32KHz、4411KHz或48KHz。Layer1是为数字压缩磁带DCC(DigitalCompactCassette)设计的,数据流量为384kbps,Layer2在复杂性和性能间作了权衡,数据流量下降到256kbps-192kbps。Layer3一开始就为低数据流量而设计,数据流量在128kbps-112kbps,Layer3增加了MDCT变换,使其频率分辨能力是Layer2的18倍,Layer3还使用了与MPEGVid2eo类似的平均信息量编码(EntropyCoding),减少了冗余信息。MP3绝大部分使用的是MPEG21标准。

音频压缩

MP3格式始于80年代中期,德国Erlangen的Fraunhofer研究所致力于高质量、低数据率的声音编码。

MP3音频压缩包含编码和解码两个部分。编码是将WAV文件中的数据转换成高压缩率的位流形式,解码是接受位流并将其重建到WAV文件中。

MP3采用了感知音频编码(PerceptualAudioCoding)这一失真算法。人耳感受声音的频率范围是20Hz-220kHz,MP3截掉了大量的冗余信号和无关的信号,编码器通过混合滤波器组将原始声音变换到频率域,利用心理声学模型,估算刚好能被察觉到的噪声水平,再经过量化,转换成Huffman编码,形成MP3位流。解码器要简单得多,它的任务是从编码后的谱线成分中,经过反量化和逆变换,提取出声音信号。

在压缩音频数据时,先将原始声音数据分成固定的分块,然后作顺向MDCT变换,MDCT本身并不进行数据压缩,只是将一组时域数据转换成频域数据,以得知时域变化情况,顺向MDCT将每块的值转换为512个MDCT系数。量化使数据得到压缩,在对量化后的变换样值进行比特分配时要考虑使整个量化块最小,这就成为有损压缩了。解压时,经反向MDCT将512个系数还原成原始声音数据,前后的原始声音数据是不一致的,因为在压缩过程中,去掉了冗余和不相关数据。

MP3文件结构

原文链接: https://wenku.baidu.com/view/d4877350ad02de80d4d840cb.html

以上是关于MP3格式音频文件结构解析的主要内容，如果未能解决你的问题，请参考以下文章

MP3转AAC音频格式怎么使用音频转换器转换？