有没有人成功使用 CMU Sphinx 进行语音识别编程

Posted 2023-02-19

技术标签:

【中文标题】有没有人成功使用 CMU Sphinx 进行语音识别编程【英文标题】：Has Anyone Successfully Used CMU Sphinx for Programming by Voice Recognition 【发布时间】：2013-05-14 14:23:38 【问题描述】：

我想开始通过语音识别软件进行一些编码（可能是我所做工作的 10-20%）。

我看到有些人使用 Dragon Natural Speech (DNS) 软件取得了成功，但我使用的是 Mac，不幸的是，Dragon 只能在 Windows 上运行。

有人使用 Carnegie Melon 开源 Sphinx http://cmusphinx.sourceforge.net/ 进行编程吗？

还有其他可以在 Mac 上实现的选项吗？我不介意投入一点现金来实现这一点。理想情况下，这将是一个我可以添加自己的命令的系统。（看看这家伙用 DNS 做了什么很棒的事情：https://www.youtube.com/watch?v=8SkdfdXWYaI）

【问题讨论】：

答案是肯定的，甚至还有点乱七八糟的project about that on sourceforge。如果通过扬声器适配正确完成，CMUSphinx 可以非常准确和有用。但是 *** 可能不是讨论这种开放式问题的最佳场所。 【参考方案1】：

如果您不习惯使用 Sphinx，我会推荐 Kaldi 作为适应性强、兼容的开源语音识别器。使用 kaldi，您可以调整自己的语法和命令并重新训练底层模型。另外，还有一个python-wrapper，让Kaldis使用起来简单方便。

【讨论】：

【参考方案2】：

JetBrains 开发人员为 IDEA 编写了一个 protoype 插件。这项工作是在他们的一次黑客马拉松期间完成的。

【讨论】：

以上是关于有没有人成功使用 CMU Sphinx 进行语音识别编程的主要内容，如果未能解决你的问题，请参考以下文章

CMU Sphinx 可以设置为识别约 200 个单词吗

PocketSphinx语音识别系统的编译安装和使用

使用 TensorFlow 进行端到端语音识别的 RNN

sphinx4 中的语音识别响应很差

有没有办法通过 ms 说话人识别将 MS 语音与文本接口？

语音识别spinx4切换中文模型时报错IndexOutOfBoundsException