C/C++ 中的梅尔频率倒谱系数 (MFCC)

Posted

技术标签:

【中文标题】C/C++ 中的梅尔频率倒谱系数 (MFCC)【英文标题】:Mel Frequency Cepstral Coefficients (MFCC) in C/C++ 【发布时间】:2012-10-18 22:31:05 【问题描述】:

在 C/C++ 中是否有任何可用的 MFCC 实现?有源代码或库吗?

我已经找到了http://code.google.com/p/libmfcc/,看起来不错。

【问题讨论】:

【参考方案1】:

2016 年回顾:

libmfcc 很简单,MIT 许可证,自 2010 年起不受支持。 YAAFE 提供 MFCC 和其他功能,LGPLv3,自 2011 年起不受支持。 Kaldi 太过分了,但它只能用于 MFCC。 Apache 许可证 v2.0,仍然受支持。 PocketSphinx 是用于语音识别、CMU 许可证(BSD 风格)的 CMU 工具包,并且仍然受支持。 SPTK 是来自日本的研究工具包,修改后的 BSD 许可证,仍然受支持。 OpenSMILE 有两个许可证:(1) 一个用于研究和个人使用的灵活许可证,以及 (2) 一个商业许可证。

注意我提到的是 PocketSphinx,而不是 Sphinx,因为后者是用 Java 编写的。

【讨论】:

【参考方案2】:

您可以使用开源语音识别工具包中的前端,例如 Kaldi 或Sphinx。

【讨论】:

以上是关于C/C++ 中的梅尔频率倒谱系数 (MFCC)的主要内容,如果未能解决你的问题,请参考以下文章

音频处理梅尔频率倒谱系数(MFCC)

梅尔频率倒谱系数如何工作?

浅谈MFCC

语音识别基于MFCC的GMM语音识别matlab源码

语音识别基于MFCC和SVM的特定人性别识别matlab源码

语音识别基于结合mfcc和lpc特征SVM支持向量机实现中英语种识别matlab源码