音频基础知识-PCMAAC

Posted fang·up·ad

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了音频基础知识-PCMAAC相关的知识,希望对你有一定的参考价值。

一、PCM 

说到音频,主要有两个概念比较重要,一个是采集到的原始音频数据(比如PCM)和压缩后的音频数据(比如AAC)。

1.什么是PCM?

PCM(Pulse Code Modulation,脉冲编码调制)音频数据是未经压缩的音频采样数据裸流,它是由模拟信号经过采样、量化、编码转换成的标准数字音频数据。

2.如何理解PCM?

PCM是一种用数字表示模拟信号经过采样后的数据的方法。主要包括采样,量化,编码三个主要过程。

 ◆ 先来看看模拟信号被采样的过程:

 ◆ 采样率:每秒钟采样的样本数。比如我们常说的44.1kHz,即每秒钟采样44100次。

 ◆ 量化:将采样到的信号数据四舍五入到一个可用整数表示的过程。(位深)。

        连续的模拟信号按一定的采样频率经数码脉冲取样后,每一个离散的脉冲信号被以一定的量化精度量化成一串二进制编码流,这串编码流的位数即为采样深度。位深就是说用多少个比特表示某一个时间点上的振幅。比特数越多,可以表示的振幅变化就越精确,那么声音就会越逼真。

 ◆ 编码:将量化后的信号转换成二进制数据。

3.描述PCM数据的6个参数:

 ◆ Sample Rate : 采样频率。8kHz(电话)、44.1kHz(CD)、48kHz(DVD)。

 ◆ Sample Size : 量化位数。常见值为8-bit、16-bit。

 ◆ Number of Channels : 通道个数。常见的音频有立体声(stereo)和单声道(mono)两种类型,立体声包含左声道和右声道。另外还有环绕立体声等其它不太常用的类型。

 ◆ Sign : 表示样本数据是否是有符号位,比如用一字节表示的样本数据,有符号的话表示范围为-128 ~ 127,无符号是0 ~ 255。

 ◆ Byte Ordering : 字节序。字节序是little-endian还是big-endian。通常均为little-endian。

 ◆ Integer Or Floating Point : 整形或浮点型。大多数格式的PCM样本数据使用整形表示,而在一些对精度要求高的应用方面,使用浮点类型表示PCM样本数据。

二、音频编码协议 AAC 

 1.什么是AAC?

AAC(Advanced Audio Coding,高级音频编码)是一种声音数据的文件压缩格式。AAC分为ADIF和ADTS两种文件格式。

2.什么是ADIF和ADTS?

 ◆ ADIF:Audio Data Interchange Format 音频数据交换格式。这种格式的特征是只有音频数据最前面具有头字节,音频数据流中间没有头字节。因此它的解码只能在头字节处开始进行。故这种格式常用在磁盘文件中。

 ◆ ADTS:Audio Data Transport Stream 音频数据传输流。这种格式的特征是它每一单元音频数据都有一个header字节,解码可以在这个流中任何位置开始。

3.ADTS的数据结构是怎样的?

4.音频数据抓包分析

        音频数据单元开头是FF F1,对应二进制是11111111 11110001,对比协议 前12bit全是1,然后下一bit是0,说明MPEG version 4,然后连续两个0,下一位是1表明没有CRC。

Android音频开发:音频基础知识


一、Android音频开发(一):音频基础知识
二、Android音频开发(二):录制音频(WAV及MP3格式)
三、Android音频开发(三):使用ExoPlayer播放音频
四、Android音频开发(四):音频播放模式
五、Android音频开发(五):感应(息屏/亮屏)管理

附GitHub源码:MultimediaExplore


 

1、采样频率:
    一秒钟内采样的点(次)数称为采样频率,采样频率越高越接近原始信号。常用的音频采样频率有:8kHz、16kHz、44.1kHz、96kHz、192kHz等。

2、采样位宽【采样精度 / 位深度】:
    采样位数就是采样值用多少位0和1来表示,也叫采样精度,用的位数越多就越接近真实声音。 常见的位宽有:8bit 或者16bit。

3、声道:
    语音一般只有一个声道,音乐有两个声道,环绕立体声可以有多个声道。

4、编解码:
    音频采样过程也叫做脉冲编码调制编码,即PCM(Pulse Code Modulation)编码。
    编码过程:模拟信号->抽样->量化->编码->数字信号.

5、压缩:
    <1>无损编码:如能够达到最高保真水平的就是PCM编码、WAV格式。
    <2>有损编码:如MP3格式.
    MP3格式是按1:12压缩保存的,所以MP3格式大小等于WAV的1/12

6、码率:
     又称为比特率,是指一个音频流中每秒钟能通过的数据量。  
     码率 = 采样频率(44.1k)* 采样位数(16)* 声道个数(2)= 1411.2kbps。
     知道音频码率后,可求得整个音频文件的大小=时长(300s)*码率(1411.2)/1024/8=51.67M。

 7、常用音频格式:
    <1>WAV格式:音质高 无损格式 体积较大。
    <2>AAC格式:相对于 mp3,AAC 格式的音质更佳,文件更小,有损压缩。
    <3>AMR格式:压缩比比较大,但相对其他的压缩格式质量比较差,多用于人声,通话录音。
    <4>mp3格式:特点 使用广泛,有损压缩,牺牲了12KHz到16KHz高音频的音质。

以上是关于音频基础知识-PCMAAC的主要内容,如果未能解决你的问题,请参考以下文章

音视频--音频基础

Android音视频音频基础

Android音视频音频基础

《音视频开发》系列-总览

音视频连载-007基础学习篇-SDL 播放 PCM 音频文件(上)

一、音视频基础知识