有人可以解释这段代码如何使用 Accelerate Framework 将音量转换为分贝吗?

Posted

技术标签:

【中文标题】有人可以解释这段代码如何使用 Accelerate Framework 将音量转换为分贝吗?【英文标题】:Can someone explain how this code converts volume to decibels using the Accelerate Framework? 【发布时间】:2015-02-20 10:37:40 【问题描述】:

我正在使用 EZAudio 构建一个 ios 应用。它的委托返回一个float** 缓冲区,其中包含指示检测到的音量的浮点值。这个委托被不断调用,它的工作在不同的线程中完成。

我要做的是从 EZAudio 获取浮点值并将其转换为分贝。


EZAudioDelegate

这是我的简化版EZAudio Delegate for getting Microphone Data:

- (void)microphone:(EZMicrophone *)microphone hasAudioReceived:(float **)buffer withBufferSize:(UInt32)bufferSize withNumberOfChannels:(UInt32)numberOfChannels 
    /*
     *  Returns a float array called buffer that contains the stereo signal data
     *  buffer[0] is the left audio channel
     *  buffer[1] is the right audio channel
     */

    // Using a separate audio thread to not block the main UI thread
    dispatch_async(dispatch_get_main_queue(), ^

        float decibels = [self getDecibelsFromVolume:buffer withBufferSize:bufferSize];

        NSLog(@"Decibels: %f", decibels);

    );



问题

问题是,在通过以下链接实施解决方案后,我不明白它是如何工作的。如果有人能解释它如何将音量转换为分贝,我将不胜感激

How to convert audio input to DB? #85

How to change the buffer size to increase FFT window? #50

Changing Buffer Size #84


代码

解决方案使用Accelerate Framework中的以下方法将音量转换为分贝:

vDSP_vsq vDSP_meanv vDSP_vdbcon

下面是从 EZAudio Delegate 调用的方法getDecibelsFromVolume。它从委托传递float** bufferbufferSize

- (float)getDecibelsFromVolume:(float**)buffer withBufferSize:(UInt32)bufferSize 

    // Decibel Calculation.

    float one = 1.0;
    float meanVal = 0.0;
    float tiny = 0.1;
    float lastdbValue = 0.0;

    vDSP_vsq(buffer[0], 1, buffer[0], 1, bufferSize);

    vDSP_meanv(buffer[0], 1, &meanVal, bufferSize);

    vDSP_vdbcon(&meanVal, 1, &one, &meanVal, 1, 1, 0);


    // Exponential moving average to dB level to only get continous sounds.

    float currentdb = 1.0 - (fabs(meanVal) / 100);

    if (lastdbValue == INFINITY || lastdbValue == -INFINITY || isnan(lastdbValue)) 
        lastdbValue = 0.0;
    

    float dbValue = ((1.0 - tiny) * lastdbValue) + tiny * currentdb;

    lastdbValue = dbValue;

    return dbValue;

【问题讨论】:

您是否查看了 Accelerate/vDSP.h 以了解 vDSP 功能的作用? 【参考方案1】:

我将解释如何使用代码计算信号的 dB 值,然后说明它与 vDSP 示例的关系。

首先,计算一块数据的 RMS 和

double sumSquared = 0;
for (int i = 0 ; i < numSamples ; i++)

   sumSquared += samples[i]*samples[i];

double rms = sumSquared/numSamples;

有关RMS的更多信息

接下来将 RMS 值转换为 dB

double dBvalue = 20*log10(rms);

这与示例代码有何关系

vDSP_vsq(buffer[0], 1, buffer[0], 1, bufferSize);

这一行循环遍历缓冲区并计算缓冲区中所有元素的平方。如果缓冲区在调用之前包含值[1,2,3,4],那么在调用之后它将包含值[1,4,9,16]

vDSP_meanv(buffer[0], 1, &meanVal, bufferSize);

这一行循环遍历缓冲区,对缓冲区中的值求和,然后返回总和除以元素的数量。所以对于输入缓冲区[1,4,9,16] in 计算总和30,除以4 并返回结果7.5

vDSP_vdbcon(&meanVal, 1, &one, &meanVal, 1, 1, 0);

这一行将meanVal 转换为分贝。在这里调用向量化函数确实没有意义,因为它只对单个元素进行操作。然而,它所做的是将参数插入以下公式:

meanVal = n*log10(meanVal/one)

其中n1020,具体取决于最后一个参数。在这种情况下,它是1010 用于功率测量,20 用于幅度。我认为20 更适合您使用。

最后一点代码看起来正在对结果进行一些简单的平滑处理,以使仪表不那么有弹性。

【讨论】:

非常感谢@jacket!您能否解释一下您的意思:"There is really no point in calling a vectorized function here since it is only operating on a single element." 当您说vectorized function 时,您指的是vDSP_vdbcon 吗?会有什么变化? 我的意思是 vDSP_vdbcon 已优化为将值数组转换为 dB,但您的代码仅使用单个浮点数 meanVal 调用它。这并不是真的毫无意义,只是不会像meanVal = 20*log10(meanVal);那样编写编码来获得任何性能优势 天啊.. 苹果真的很喜欢把事情复杂化。非常感谢您的解释。

以上是关于有人可以解释这段代码如何使用 Accelerate Framework 将音量转换为分贝吗?的主要内容,如果未能解决你的问题,请参考以下文章

有人可以解释这段 JavaScript 代码吗

有人能解释一下这段代码中的法线是如何计算的吗?

递归函数:有人能解释一下这段代码是如何打印 1 到 5 的吗?

有人可以解释一下这个与 Js 回调函数有关的代码吗?我对这段代码很困惑,可能是因为我是初学者。问题是:

KeyStore、HttpClient 和 HTTPS:有人可以向我解释这段代码吗?

有人可以向我解释这段代码吗?我需要了解 Python for 循环的人