ios 使用audioQueue 录音以及播放 (pcm)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ios 使用audioQueue 录音以及播放 (pcm)相关的知识,希望对你有一定的参考价值。

参考技术A 希望能给大家一些帮助,或者得到大神们的建议.

audioqueue 是以队列的方式处理数据.

一 录音:

Audio Queues for Recording

一个用于record 的audio queue,需要使用AudioQueueNewInput方法创建,它的具体结构如图:

 上面是苹果 对于 audioqueue 录音的步骤解释.(个人理解如下)

    (1)麦克风设备收到音频设备

    (2)音频设备传数据到buffer

    (3)buff  数据传递到 callback函数中

二 播放:

对于这个播放的callback , 个人理解是播放结束后系统 调用 ,对于core audio 理解不足,不便做出说明.

有需要的, 分享个本人已经封装好了的 Demo 

https://github.com/xixi9527/AudioqueuePlayer
 封装好了的audioqueue player

iOS音频播放之AudioQueue:播放本地音乐

iOS实现播放本地音乐,有非常多种方法。比如AVAudioPlayer,这些都能非常好的胜任。有人就奇怪了。为什么要退而求其次。使用更复杂的AudioQueue来播放本地音乐呢?请继续往下看

AudioQueue简单介绍

AudioQueue,在苹果的开发人员文档上是这么说的

"Audio Queue Services provides a straightforward, low overhead way to record and play audio in iOS and Mac OS X."

AudioQueue官方文档

AudioQueue服务提供一种直接的,低开销的方式以用于在iOS及Mac OS X上录音和播放音乐。

使用AudioQueue播放音乐的长处就是开销非常小并且支持流式播放(边下边播)。可是缺点就是开发难度大。所以有网络音频库AudioStreamer,网上有非常多讲AudioQueue的。可是有实例代码说明的,实在是少之又少。正好公司项目有音频需求,尽管项目中使用的并不是我自己写的音频播放功能,但事后还是想自己来研究一下,这个在我看来比較奇妙也比較有趣的AudioQueue。

AudioStreamer说明

iOS上一个比較有名的流媒体音频播放库是AudioStreamer,该库即使用了AudioQueue。只是该音频库并不支持本地音乐播放,我感觉非常奇怪,为什么作者不支持。并且在使用过程中,我发现该库还是有点问题,尽管我对音频方面的知识并不怎么了解,也并不能与大师媲美并论。但我也希望通过自己的学习,终于完成一个相似AudioStreamer的网络音乐库,眼下或许仅仅是一个设想。无论最后自己有没有那能力,起码我以前也尝试过。只是工作近期比較忙,加上自己知识的欠缺。不知何时才干实现。本次就先来补上AudioStreamer没有支持的,使用AudioQueue播放本地音乐。

AudioQueue具体解释

AudioQueue工作原理

我从Apple的官方文档上截下下面该图:
技术分享图片

该图非常好的说明了AudioQueue的工作原理,例如以下说明:
1. 用户调用对应的方法,将音频数据从硬盘中读入到AudioQueue的缓冲区中,并将缓冲区送入音频队列。


2. 用户App通过AudioQueue提供的接口。告诉外放设备,缓冲区中已经有数据。能够拿去播放。
3. 当一个缓冲区中的音频数据播放完成之后,AudioQueue告诉用户,当前有一个空的缓冲区能够用来给你填充数据。


4. 反复以上步骤。直至数据播放完成。

到这里,肯定有不少同学发现了,AudioQueue事实上就是生产者-消费者模型的典型应用。

AudioQueue主要接口

AudioQueueNewOutput

OSStatus AudioQueueNewOutput(const AudioStreamBasicDescription *inFormat, AudioQueueOutputCallback inCallbackProc, void *inUserData, CFRunLoopRef inCallbackRunLoop, CFStringRef inCallbackRunLoopMode, UInt32 inFlags, AudioQueueRef  _Nullable *outAQ);

该方法用于创建一个用于输出音频的AudioQueue

參数及返回说明例如以下:
1. inFormat:该參数指明了即将播放的音频的数据格式
2. inCallbackProc:该回调用于当AudioQueue已使用完一个缓冲区时通知用户,用户能够继续填充音频数据
3. inUserData:由用户传入的数据指针,用于传递给回调函数
4. inCallbackRunLoop:指明回调事件发生在哪个RunLoop之中,假设传递NULL,表示在AudioQueue所在的线程上运行该回调事件,普通情况下,传递NULL就可以。
5. inCallbackRunLoopMode:指明回调事件发生的RunLoop的模式,传递NULL相当于kCFRunLoopCommonModes,通常情况下传递NULL就可以
6. outAQ:该AudioQueue的引用实例,

返回OSStatus,假设值为noErr。则表示没有错误。AudioQueue创建成功。

AudioQueueAllocateBuffer

OSStatus AudioQueueAllocateBuffer(AudioQueueRef inAQ, UInt32 inBufferByteSize, AudioQueueBufferRef  _Nullable *outBuffer);

该方法的作用是为存放音频数据的缓冲区开辟空间

參数及返回说明例如以下:
1. inAQ:AudioQueue的引用实例
2. inBufferByteSize:须要开辟的缓冲区的大小
3. outBuffer:开辟的缓冲区的引用实例

返回OSStatus,假设值为noErr,则表示缓冲区开辟成功。

AudioQueueEnqueueBuffer

OSStatus AudioQueueEnqueueBuffer(AudioQueueRef inAQ, AudioQueueBufferRef inBuffer, UInt32 inNumPacketDescs, const AudioStreamPacketDescription *inPacketDescs);

该方法用于将已经填充数据的AudioQueueBuffer入队到AudioQueue

參数及返回说明例如以下:
1. inAQ:AudioQueue的引用实例
2. inBuffer:须要入队的缓冲区实例
3. inNumPacketDescs:缓冲区中共存在有多少帧音频数据
4. inPacketDescs:缓冲区中每一帧的相关信息。用户须要指明当中每一帧在缓冲区中数据的偏移值,通过字段mStartOffset来指定

返回OSStatus。假设值为noErr,则表示缓冲区已经成功入队。等待播放

AudioQueueStart Pause Stop Flush Reset Dispose

OSStatus AudioQueueStart(AudioQueueRef inAQ, const AudioTimeStamp *inStartTime);
OSStatus AudioQueuePause(AudioQueueRef inAQ);
OSStatus AudioQueueStop(AudioQueueRef inAQ, Boolean inImmediate);
OSStatus AudioQueueFlush(AudioQueueRef inAQ);
OSStatus AudioQueueReset(AudioQueueRef inAQ);
OSStatus AudioQueueDispose(AudioQueueRef inAQ, Boolean inImmediate);

顾名思义,前三个方法用于音频的播放,暂停及停止。

后两个方法用于在最后清洗及重置音频队列,清洗确保队列中的数据全然输出。AudioQueuDispose用于清理AudioQueue所占资源。

參数及返回说明例如以下:
1. inAQ:AudioQueue的引用实例
2. inStartTime:指明要開始播放音频的时间,假设要马上開始。传递NULL
3. inImmediate:指明是否要马上停止音频播放,如是。传递true

返回OSStatus表示相关的操作是否成功运行。

AudioQueueFreeBuffer

OSStatus AudioQueueFreeBuffer(AudioQueueRef inAQ, AudioQueueBufferRef inBuffer);

该方法用于在播放结束时。释放清理缓冲区时使用

AudioQueueGetProperty AudioQueueSetProperty

OSStatus AudioQueueGetProperty(AudioQueueRef inAQ, AudioQueuePropertyID inID, void *outData, UInt32 *ioDataSize);
OSStatus AudioQueueSetProperty(AudioQueueRef inAQ, AudioQueuePropertyID inID, const void *inData, UInt32 inDataSize);

此GET/SET方法,用于设置获取AudioQueue的相关属性,请參看AudioQueue.h头文件里的相关说明。

音频播放(LocalAudioPlayer)

使用AudioQueue播放音乐,一般须要配合AudioFileStream一起,AudioFileStream负责解析音频数据。AudioQueue负责播放解析到的音频数据。

此次仅实现最主要的本地音频播放功能。旨在为以后打下基础,不处理不论什么相关的状态(如暂停、停止、SEEK),错误等。

播放方式相似流式播放,仅仅是音频数据来源于本地文件而非网络。需经过下面几个步骤:
1. 持续不断的从文件里读取部分数据,直到数据所有读取结束
2. 将文件里读出的数据,交给AudioFileStream进行数据解析
3. 创建AudioQueue,当数据放入到AudioQueueBuffer中
4. 将缓冲区放到到AudioQueue中,開始播放音频
5. 播放音频结束,清理相关资源

播放器的初始化

播放器的init主要用于指定要播放的音频文件,例如以下所看到的:
技术分享图片
读取文件操作,使用NSFileHandle类。audioInUseLock,是一个NSLock*类型,用于在AudioQueue通知我们有空的缓冲区能够使用时做标记。

我们在用户点击playbutton的时候,初始化该播放器,并调用play方法进行播放
技术分享图片

播放音频

播放音频将分为下面步骤:
1. 读取并開始解析音频
2. 解析音频信息
3. 解析音频帧
4. 播放音频数据
5. 清理相关资源

我们先定义几个宏,用于指定一些缓冲区的大小

#define kNumberOfBuffers 3              //AudioQueueBuffer数量。一般指明为3
#define kAQBufSize 128 * 1024           //每一个AudioQueueBuffer的大小
#define kAudioFileBufferSize 2048       //文件读取数据的缓冲区大小
#define kMaxPacketDesc 512              //最大的AudioStreamPacketDescription个数

LocalAudioPlayer相关属性

LocalAudioPlayer中定义的属性例如以下所看到的:
技术分享图片

读取并開始解析音频

我们使用AudioFileStream来解析音频信息。在用户调用play方法之后。首先调用AudioFileStreamOpen,打开AudioFileStream,例如以下所看到的:
技术分享图片

extern OSStatus 
AudioFileStreamOpen (void *inClientData, AudioFileStream_PropertyListenerProc   inPropertyListenerProc, AudioFileStream_PacketsProc             inPacketsProc, AudioFileTypeID                          inFileTypeHint, AudioFileStreamID * outAudioFileStream);

AudioFileStreamOpen的參数说明例如以下:
1. inClientData:用户指定的数据,用于传递给回调函数。这里我们指定(__bridge LocalAudioPlayer*)self
2. inPropertyListenerProc:当解析到一个音频信息时。将回调该方法
3. inPacketsProc:当解析到一个音频帧时,将回调该方法
4. inFileTypeHint:指明音频数据的格式。假设你不知道音频数据的格式,能够传0
5. outAudioFileStream:AudioFileStreamID实例,需保存供兴许使用

读取到数据之后。调用AudioFileStreamParseBytes解析数据,其原型例如以下:

extern OSStatus
AudioFileStreamParseBytes(AudioFileStreamID inAudioFileStream, UInt32 inDataByteSize, const void * inData, AudioFileStreamParseFlags inFlags);

參数的说明例如以下:
1. inAudioFileStream:AudioFileStreamID实例,由AudioFileStreamOpen打开
2. inDataByteSize:此次解析的数据字节大小
3. inData:此次解析的数据大小
4. inFlags:数据解析标志。当中仅仅有一个值kAudioFileStreamParseFlag_Discontinuity = 1,表示解析的数据是否是不连续的,眼下我们能够传0。

当文件数据合部读取结束的时候,此时便能够关闭文件。

解析音频信息

假设解析到音频信息,那么将会调用之前指定的回调函数,例如以下所看到的:
技术分享图片
技术分享图片

每一个相关的属性都能够调用AudioFileStreamGetProperty来获取到对应的值,原型例如以下:

extern OSStatus
AudioFileStreamGetProperty(AudioFileStreamID inAudioFileStream, AudioFileStreamPropertyID inPropertyID, UInt32 *ioPropertyDataSize, void *                              outPropertyData);

參数说明:
1. inAudioFileStream:AudioFileStreamID实例,由AudioFileStreamOpen打开
2. inPropertyID:要获取的属性名称。參见AudioFileStream.h
3. ioPropertyDataSize:指明该属性的大小
4. outPropertyData:用于存放该属性值的空间

kAudioFileStreamProperty_DataFormat

该属性指明了音频数据的格式信息,返回的数据是一个AudioStreamBasicDescription结构。需保存用于AudioQueue的使用

kAudioFileStreamProperty_FileFormat

该属性指明了音频数据的编码格式,如MPEG等。

kAudioFileStreamProperty_AudioDataByteCount

该属性可获取到音频数据的长度,可用于计算音频时长,计算公式为:
时长 = (音频数据字节大小 * 8) / 採样率

kAudioFileStreamProperty_BitRate

该属性可获取到音频的採样率。可用于计算音频时长

kAudioFileStreamProperty_DataOffset

该属性指明了音频数据在整个音频文件里的偏移量:
音频文件总大小 = 偏移量 + 音频数据字节大小

kAudioFileStreamProperty_AudioDataPacketCount

该属性指明了音频文件里共同拥有多少帧

kAudioFileStreamProperty_ReadyToProducePackets

该属性告诉我们,已经解析到完整的音频帧数据,准备产生音频帧。之后会调用到另外一个回调函数。我们在这里创建音频队列AudioQueue,假设音频数据中有Magic Cookie Data,则先调用AudioFileStreamGetPropertyInfo,获取该数据是否可写,假设可写再取出该属性值,并写入到AudioQueue。之后便是音频数据帧的解析。

解析音频帧

音频信息解析完成之后,就应该解析音频数据帧了,代码例如以下所看到的:

技术分享图片
在这里。我们利用之前设置的inClientData,将该回调函数,由C语言形式改为Objc的形式,解析到音频数据之后的处理代码例如以下所看到的:
技术分享图片

解析到音频数据之后,我们要将数据写入到AudioQueueBuffer中,首先,该回调函数的原型例如以下所看到的:

typedef void (*AudioFileStream_PacketsProc)(void *              inClientData, UInt32 inNumberBytes,UInt32       inNumberPackets, const void *inInputData,                           AudioStreamPacketDescription *inPacketDescriptions);

參数说明:
1. inClientData:由AudioFileStreamOpen设置的用户数据
2. inNumberBytes:音频数据的字节数
3. inNumberPackets:解析到的音频帧数
4. inInputData:包括这些音频数据帧的数据
5. inPacketDescriptions:AudioStreamPacketDescription数组。当中包括mStartOffset,指明了该帧相关数据的起始位置。mDataByteSize指明了该帧数据的大小。

此时我们首先创建一个音频队列。用以播放音频。并为每一个缓冲区分配空间,例如以下所看到的:
技术分享图片

之后我们遍历每一帧。获取每一帧的偏移位置及数据大小,假设当前帧的数据大小,已经无法存放到当前的缓冲区当中,此时,我们应该将当前的缓冲区入队。改动当前使用的缓冲区为下一个。并重置相关的数据填充信息及已包括的数据帧信息。

self.audioQueueCurrentBufferIndex = (++self.audioQueueCurrentBufferIndex) % kNumberOfBuffers;
self.audioPacketsFilled = 0;
self.audioDataBytesFilled = 0;

假设此时还没有開始播放音乐,则能够開始播放音乐

if(self.isPlaying == NO) {
    err = AudioQueueStart(audioQueueRef, NULL);
    self.isPlaying = YES;
}

若下一个指定的缓冲区已经在使用。即所有缓冲区已满且入队。则应该进行等待

while(inuse[self.audioQueueCurrentBufferIndex]);

最后,假设缓冲区空间还能存放一帧数据,我们就使用memcpy将数据拷贝到缓冲区中对应的位置上去,保存每一帧的相关信息,设置每一帧在缓冲区中的偏移量(mStartOffset),设置当前缓冲区已存方的数据大小。及已包括的帧量。

当一个缓冲区使用结束之后,AudioQueue将会调用之前由AudioQueueNewOutput设置的回调函数,例如以下所看到的:

技术分享图片
在该回调中,我们遍历每一个缓冲区,找到空缓冲区。将该缓冲区的标记改动为未使用。

播放音频数据

在处理数据帧的时候。假设缓冲区已经满(指缓冲区的空间不足以存放下一帧数据),则此时能够開始播放音频

if(self.isPlaying == NO) {
    err = AudioQueueStart(audioQueueRef, NULL);
    self.isPlaying = YES;
}

我们还能够调用AudioQueuePause等相关方法来暂停和终止音频播放。例如以下所看到的:

技术分享图片

清理相关资源

终于。我们清理相关资源,在前面,我们利用了AudioQueueAddPropertyListener为kAudioQueueProperty_IsRunning属性设置了一个监听器,当AudioQueue启动或者是终止的时候,会调用该函数:
技术分享图片

该回调函数,例如以下所看到的:
技术分享图片

在该方法中,我们使用AudioQueueReset重置播放队列,调用AudioQueueFreeBuffer释放缓冲区空间,释放AudioQueue所有资源,关闭AudioFileStream。

只是在实际使用过程中,我发现数据为空的时候AudioQueue并不会主动终止,即不会主动调用该回调。所以我想,应该是要我们自己获取到当前播放的进度,当播放完成的时候调用AudioQueueStop终止播放吧,这个问题留着待以后再继续研究。

结束

终于完成了所有的代码,用户仅仅要点击play,即能够听到《遥远的她》这首美妙的音乐了。因为界面上仅仅有一个playbutton。不放演示图了。戴上耳机。静静的享受自己的成果与这美妙的音乐。

































































以上是关于ios 使用audioQueue 录音以及播放 (pcm)的主要内容,如果未能解决你的问题,请参考以下文章

ios音频:使用audioqueue改变播放进度

iOS音频播放之AudioQueue:播放本地音乐

iOS音频播放之AudioQueue:播放本地音乐

iOS AudioQueue播放AAC数据总是延迟2-3秒

iOS(Objective-C)在AudioQueue中播放AAC文件的问题

iOS:使用 AudioQueue 时快进音频