在与 Windows Azure 服务的对话中识别特定声音

Posted

技术标签:

【中文标题】在与 Windows Azure 服务的对话中识别特定声音【英文标题】:Recognize a specific sound in a conversation with Windows Azure services 【发布时间】:2017-05-29 15:08:35 【问题描述】:

我想知道是否可以使用 Windows Azure 的认知服务创建一个服务,让我能够识别对话中的一种特定声音(由互联网上的实时流提供)以及如何制作它。 我已经知道机器学习的基本技术,但我从来没有实现过这样的东西,无论如何我想使用认知服务以一种简单有效的方式来实现它。 该任务将与事件链等其他任务相关联,因此我应该使用为 Java 或 Python 提供 SKD 的东西。 有人知道我该怎么做吗? 谢谢!

【问题讨论】:

【参考方案1】:

现在,有一个名为Speaker Recognition API的新预览认知服务,您可以使用它来实现识别对话中特定声音的需求,请查看官方overview了解详情。目前,该服务只有 REST API,没有针对特定编程语言(如 Java/Python)的 SDK。因此,请移至 REST API 参考 website 以了解如何使用它。

希望对你有帮助。

【讨论】:

以上是关于在与 Windows Azure 服务的对话中识别特定声音的主要内容,如果未能解决你的问题,请参考以下文章

Windows Azure 服务总线 - 一般问题

“python”中是不是提供 azure 对话转录服务?

DeleteAsync 方法在 Azure 人脸识别服务中不起作用

Azure Speech-To-Text 多语音识别

如何在与 Azure Active Directory 关联的 Azure SQL 数据库级别创建不同的资源组

Azure API 无法识别来自 Terraform 的服务主体