Microsoft 语音识别属性调整

Posted 2023-03-10

技术标签:

【中文标题】Microsoft 语音识别属性调整【英文标题】：Microsoft Speech Recognition Properties Tweaking 【发布时间】：2014-01-20 17:25:59 【问题描述】：

可以使用属性 ( http://msdn.microsoft.com/en-us/library/System.Speech.Recognition.SpeechRecognitionEngine_properties.aspx)

初始沉默喋喋不休结束沉默 endSilenceAmbiguous

我正在寻找调整这些属性的用例。例如我应该怎么做 - 如果我想匹配一个简短的词，例如是/否 - 如果我想匹配一个长句

这些属性如何适应 SubSetMatching 模式 (http://msdn.microsoft.com/en-us/library/system.speech.recognition.subsetmatchingmode(v=vs.110).aspx)？

顺便说一句：有没有办法在语法的 XML 中设置 SubSetMatching 模式？

【问题讨论】：

【参考方案1】：

减少BabbleTimeout 在嘈杂的环境中很有用。然而，在较安静的环境中，这可能会导致过早地完成识别。

如果命令很短，并且您正在寻找引擎更快的响应，减少 InitialSilenceTimeout、EndSilenceTimeout 和 EndSilenceAmbiguousTimeout 会很有用。然而，同样地，将超时时间缩短太多可能会导致识别过早完成（即识别器在您说完之前完成）。

这些属性在 SR 引擎的音频处理部分进行处理，不会影响 SubsetMatchingMode。

而且，据我所知，没有办法通过 XML 控制 SubsetMatchingMode。

【讨论】：

谢谢，我看到 GrammarBuilder 使用 SubsetMatchingMode 有没有描述它做了什么？最后它建立了一个语法，但我不明白它是如何跳过短词的？它不是建立一个复杂的语法吗？还是有魔术？ SubsetMatchingMode 在概念上相当于构建一个复杂的语法，但它不是这样实现的。最后一个小问题（也许我应该把它放在别处）有没有办法建立一个语法，只做没有以前的话得到任何音频的持续时间一个句子（匹配属性） @Jean-PhilippeEncausse 我会问这个问题，因为答案比评论更重要。 ***.com/questions/21303742/…

以上是关于Microsoft 语音识别属性调整的主要内容，如果未能解决你的问题，请参考以下文章

无法使用Delphi通过Post打开Microsoft语音识别API

Microsoft 语音识别结果的格式（挪威语）

微软自定义语音识别定价方案

如何实现HTML5语音识别功能

微软语音识别速度

智能电话机器人，使用Microsoft语音识别技术（Speech sdk）(下)