语音依赖语音识别

Posted

技术标签:

【中文标题】语音依赖语音识别【英文标题】:Voice dependent speech recognition 【发布时间】:2012-12-04 09:18:13 【问题描述】:

我正在为嵌入式设备寻找依赖语音的语音识别解决方案。我看过pocketsphinx,但因为我仍然不熟悉它,我想也许更有经验的人可能知道。是否可以使用pocketsphinx 来实现这样的语音识别。它应该记录音频,提取其特征,然后将其与所说的任何内容相匹配,而不是使用声学和语言模型。是否可以使用 pocketsphinx 来实现这个流程?如果不是,有人可以为我指出这样一个解决方案的正确方向吗? 谢谢。

【问题讨论】:

【参考方案1】:

是否可以使用pocketsphinx 来实现这样的语音识别。

pocketsphinx API 中没有这样的功能

你可以做的是先用sphinxbase提取MFC系数,例如看sphinx_fe源码。

然后您可以应用 DTW 算法来比较记录。 DTW的实现很简单,就50行代码:

http://en.wikipedia.org/wiki/Dynamic_time_warping

很少有库也实现了DTW,您可以在***页面上找到链接。

很高兴看到一个演示 DTW 实现的 pocketsphinx 补丁。

【讨论】:

以上是关于语音依赖语音识别的主要内容,如果未能解决你的问题,请参考以下文章

python调用百度语音识别接口实时识别

Android 编程:循环语音识别

语音识别基于matlab GUI MFCC+VAD端点检测智能语音门禁系统含Matlab源码 451期

语音识别基于matlab GUI MFCC+VAD端点检测智能语音门禁系统含Matlab源码 451期

Chrome iOS webkit 语音识别

语音识别玩转语音识别 1 语音识别简介