梅尔频率倒谱系数如何工作?

Posted

技术标签:

【中文标题】梅尔频率倒谱系数如何工作?【英文标题】:How do Mel Frequency Cepstrum Coefficients work? 【发布时间】:2010-12-09 19:37:30 【问题描述】:

我已经根据麦克风输入实时计算出 FFT 和音高 + 绝对频率。 现在我要计算音色。

我看到了 Mel Frequency Cepstrum Coefficients - MFCCs,但我不太了解它。 有人可以给我一些建议吗..

【问题讨论】:

【参考方案1】:

MFCC 结合了对人类听觉(对数频率感知,mel scale)和乐器物理(这些系统通常具有明确定义的泛音,harmonic)的考虑——这就是 MFCC 使用 FFT 的原因FFT),给出乐器音色的简化表示(其中基频和响度被考虑在内)。

你可以写无数关于这个主题的页面,网上有很多可用的,所以一个更具体的问题可以清楚地解释你想知道的内容会很有帮助。计算 MFCC 的算法列在wikipedia page 的顶部。

【讨论】:

知道答案。所以如果我想获得音色,MFCC 是正确的方法吗? 是的,我想是的,尤其是作为对这个问题的第一次攻击。它很容易实现,有很多关于它的文章,它是与其他方法进行比较的标准(通常在这些比较中表现良好),因此它是一个不错的选择。 在 wiki 中,算法是: 1. 对信号(窗口摘录)进行傅里叶变换。 2. 使用三角形重叠窗口将上面获得的光谱的功率映射到梅尔标度上。 3. 记录每个梅尔频率的功率对数。 4. 对 mel 对数幂的列表进行离散余弦变换,就好像它是一个信号一样。 5. MFCC 是所得频谱的幅度。除了第 2 步,我什么都懂:使用三角形重叠窗口我应该怎么做,将频率传递给 mel 比例,但是这个三角形重叠窗口是什么?

以上是关于梅尔频率倒谱系数如何工作?的主要内容,如果未能解决你的问题,请参考以下文章

音频处理梅尔频率倒谱系数(MFCC)

C/C++ 中的梅尔频率倒谱系数 (MFCC)

浅谈MFCC

语音识别基于MFCC的GMM语音识别matlab源码

语音识别基于MFCC和SVM的特定人性别识别matlab源码

语音识别基于结合mfcc和lpc特征SVM支持向量机实现中英语种识别matlab源码