有没有人成功使用 CMU Sphinx 进行语音识别编程

Posted

技术标签:

【中文标题】有没有人成功使用 CMU Sphinx 进行语音识别编程【英文标题】:Has Anyone Successfully Used CMU Sphinx for Programming by Voice Recognition 【发布时间】:2013-05-14 14:23:38 【问题描述】:

我想开始通过语音识别软件进行一些编码(可能是我所做工作的 10-20%)。

我看到有些人使用 Dragon Natural Speech (DNS) 软件取得了成功,但我使用的是 Mac,不幸的是,Dragon 只能在 Windows 上运行。

有人使用 Carnegie Melon 开源 Sphinx http://cmusphinx.sourceforge.net/ 进行编程吗?

还有其他可以在 Mac 上实现的选项吗?我不介意投入一点现金来实现这一点。理想情况下,这将是一个我可以添加自己的命令的系统。 (看看这家伙用 DNS 做了什么很棒的事情:https://www.youtube.com/watch?v=8SkdfdXWYaI)

【问题讨论】:

答案是肯定的,甚至还有点乱七八糟的project about that on sourceforge。如果通过扬声器适配正确完成,CMUSphinx 可以非常准确和有用。但是 *** 可能不是讨论这种开放式问题的最佳场所。 【参考方案1】:

如果您不习惯使用 Sphinx,我会推荐 Kaldi 作为适应性强、兼容的开源语音识别器。使用 kaldi,您可以调整自己的语法和命令并重新训练底层模型。另外,还有一个python-wrapper,让Kaldis使用起来简单方便。

【讨论】:

【参考方案2】:

JetBrains 开发人员为 IDEA 编写了一个 protoype 插件。这项工作是在他们的一次黑客马拉松期间完成的。

【讨论】:

以上是关于有没有人成功使用 CMU Sphinx 进行语音识别编程的主要内容,如果未能解决你的问题,请参考以下文章

CMU Sphinx 可以设置为识别约 200 个单词吗

PocketSphinx语音识别系统的编译安装和使用

使用 TensorFlow 进行端到端语音识别的 RNN

sphinx4 中的语音识别响应很差

有没有办法通过 ms 说话人识别将 MS 语音与文本接口?

语音识别spinx4切换中文模型时报错IndexOutOfBoundsException