Microsoft 语音识别属性调整

Posted

技术标签:

【中文标题】Microsoft 语音识别属性调整【英文标题】:Microsoft Speech Recognition Properties Tweaking 【发布时间】:2014-01-20 17:25:59 【问题描述】:

可以使用属性 ( http://msdn.microsoft.com/en-us/library/System.Speech.Recognition.SpeechRecognitionEngine_properties.aspx)

初始沉默 喋喋不休 结束沉默 endSilenceAmbiguous

我正在寻找调整这些属性的用例。例如我应该怎么做 - 如果我想匹配一个简短的词,例如是/否 - 如果我想匹配一个长句

这些属性如何适应 SubSetMatching 模式 (http://msdn.microsoft.com/en-us/library/system.speech.recognition.subsetmatchingmode(v=vs.110).aspx)?

顺便说一句:有没有办法在语法的 XML 中设置 SubSetMatching 模式?

【问题讨论】:

【参考方案1】:

减少BabbleTimeout 在嘈杂的环境中很有用。然而,在较安静的环境中,这可能会导致过早地完成识别。

如果命令很短,并且您正在寻找引擎更快的响应,减少 InitialSilenceTimeoutEndSilenceTimeoutEndSilenceAmbiguousTimeout 会很有用。然而,同样地,将超时时间缩短太多可能会导致识别过早完成(即识别器在您说完之前完成)。

这些属性在 SR 引擎的音频处理部分进行处理,不会影响 SubsetMatchingMode。

而且,据我所知,没有办法通过 XML 控制 SubsetMatchingMode。

【讨论】:

谢谢,我看到 GrammarBuilder 使用 SubsetMatchingMode 有没有描述它做了什么?最后它建立了一个语法,但我不明白它是如何跳过短词的?它不是建立一个复杂的语法吗?还是有魔术? SubsetMatchingMode 在概念上相当于构建一个复杂的语法,但它不是这样实现的。 最后一个小问题(也许我应该把它放在别处)有没有办法建立一个语法,只做 没有以前的话得到任何音频的持续时间一个句子(匹配属性) @Jean-PhilippeEncausse 我会问这个问题,因为答案比评论更重要。 ***.com/questions/21303742/…

以上是关于Microsoft 语音识别属性调整的主要内容,如果未能解决你的问题,请参考以下文章

无法使用Delphi通过Post打开Microsoft语音识别API

Microsoft 语音识别结果的格式(挪威语)

微软自定义语音识别定价方案

如何实现HTML5语音识别功能

微软语音识别速度

智能电话机器人,使用Microsoft语音识别技术(Speech sdk)(下)