认知服务 - 自定义语音 C++

Posted

技术标签:

【中文标题】认知服务 - 自定义语音 C++【英文标题】:Cognitive Service - Custom Speech C++ 【发布时间】:2018-07-10 12:36:53 【问题描述】:

我正在尝试在 single 函数调用中使用自定义语音到意图,它利用自定义声学和语言模型。

我正在关注https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/intent 上的文档,旨在使用具有 LUIS 意图的连续自定义语音。

根据文档,函数

SpeechFactory::FromSubscription

在语音到意图检测的情况下,可以采用 LUIS 订阅 ID(可在 luis.ai 获得) 或者 来自语音的自定义语音订阅 ID(注册 www.cris.ai 后可用)。

有一种方法可以使用声学数据模型和自定义语言来训练自定义语音,以实现更高准确度的训练。

我已经使用自定义语言和声学数据模型训练了语音订阅,我想直接使用这些模型进行语音到意图识别。

我该怎么做?

到目前为止,我已经成功地将自定义语音与用于 STT 的声学和语言模型用于语音到意图识别的 LUIS 订阅 ID,但无法链接我的自定义LUIS Speech to Intent 模型。

我正在使用来自 cris.ai 和 luis.ai 的订阅。我对以前的 Bing STT SDK 不感兴趣,因为我的用例需要这些自定义声学模型和语言模型。

【问题讨论】:

【参考方案1】:

目前没有直接的方法可以通过单个调用同时使用 CRIS 和 LUIS(IntentRecognizer 仅支持基本模型)。作为解决方法,您可以调用 CRIS 以获取语音转文本,然后调用 LUIS 以获取意图。

谢谢,

【讨论】:

以上是关于认知服务 - 自定义语音 C++的主要内容,如果未能解决你的问题,请参考以下文章

Azure 认知服务 - 使用 python 和 websockets 自定义语音

基于 Azure 的认知服务将文本合成语音

Azure/Microsoft 认知服务自定义视觉 - 啥是对象检测模型输出张量规范?

用Azure认知服务开发一个语音翻译机,学英文很爽快

利用微软认知服务实现语音识别功能

我用3项微软 Azure人工智能认知服务打造定时语音提醒喝水助手