C/C++ 中的梅尔频率倒谱系数 (MFCC)
Posted
技术标签:
【中文标题】C/C++ 中的梅尔频率倒谱系数 (MFCC)【英文标题】:Mel Frequency Cepstral Coefficients (MFCC) in C/C++ 【发布时间】:2012-10-18 22:31:05 【问题描述】:在 C/C++ 中是否有任何可用的 MFCC 实现?有源代码或库吗?
我已经找到了http://code.google.com/p/libmfcc/,看起来不错。
【问题讨论】:
【参考方案1】:2016 年回顾:
libmfcc
很简单,MIT 许可证,自 2010 年起不受支持。
YAAFE 提供 MFCC 和其他功能,LGPLv3,自 2011 年起不受支持。
Kaldi 太过分了,但它只能用于 MFCC。 Apache 许可证 v2.0,仍然受支持。
PocketSphinx 是用于语音识别、CMU 许可证(BSD 风格)的 CMU 工具包,并且仍然受支持。
SPTK 是来自日本的研究工具包,修改后的 BSD 许可证,仍然受支持。
OpenSMILE 有两个许可证:(1) 一个用于研究和个人使用的灵活许可证,以及 (2) 一个商业许可证。
注意我提到的是 PocketSphinx,而不是 Sphinx,因为后者是用 Java 编写的。
【讨论】:
【参考方案2】:您可以使用开源语音识别工具包中的前端,例如 Kaldi 或Sphinx。
【讨论】:
以上是关于C/C++ 中的梅尔频率倒谱系数 (MFCC)的主要内容,如果未能解决你的问题,请参考以下文章