Microsoft Azure 认知服务 - 说话人识别 - 速率限制

Posted

技术标签:

【中文标题】Microsoft Azure 认知服务 - 说话人识别 - 速率限制【英文标题】:Microsoft Azure cognition services - Speaker Recognition - Rate Limit 【发布时间】:2018-03-12 13:15:24 【问题描述】:

我是 *** 的新手,我试图查找与我的主题的讨论是否已经存在但没有。

英语不是我的母语,我为我的错误提前道歉。

所以我会告诉你我的问题。我使用 Microsoft Azure 和认知服务来使用说话人识别 API。 我订阅了“随用随付”的标准定价层(每秒 5 次通话)。我使用 Unity 进行录音并将音频发送到服务器。

每隔 5 秒,我在 C# 脚本的更新函数中将音频发送到服务器。 但是大约 30 秒的语音,我收到了错误 429:代码:RateLimitExceeded,消息:超出了速率限制。请稍后再试。

如果有人使用它,你知道为什么我从服务器得到这个响应,而我有一个订阅来避免这个限制。

我加入了 Microsoft 助手,他们告诉我订阅有效,但我没有看到任何直接付款。

提前感谢您的帮助和建议, 梅巴德

【问题讨论】:

【参考方案1】:

如果您在此处查看自述文件部分中的注释https://github.com/Microsoft/Cognitive-SpeakerRecognition-Windows,

注意:确保每分钟因调整步长而产生的请求数不会超过您订阅的速率限制。

例如,对大小为 1 分钟的音频文件应用步长 1 将导致 60 个请求。对同一个音频文件应用 2 的步长将产生 30 个请求。为方便起见,我们提供了用于注册 2 个扬声器的示例音频和用于流式传输的示例音频。这些音频位于 SpeakerRecognition\Windows\Streaming\SPIDStreamingAPI-WPF-Samples\SampleAudios 下。

另外,根据https://azure.microsoft.com/en-us/services/cognitive-services/speaker-recognition/ 上的 API 链接 音频文件格式必须满足以下要求:

    容器 - WAV 编码 - PCM 速率 - 16K 示例格式 - 16 位 频道 - 单声道

如果有帮助,请告诉我。

【讨论】:

您好,感谢您的回复,很抱歉回复晚了。我发送的音频文件格式符合要求。我试图理解,但“步长”是什么意思?我每次发送多个 5 秒的音频文件。当我到达第六个或第七个文件时,我得到了“超出速率限制”。而且我认为订阅没有被考虑在内,但它是活跃的。 根据github readme.md,我们可以通过调整“步长”来控制每次识别请求之间的秒数。这意味着步长实际上是每个识别请求之间的秒数。希望对您有所帮助。

以上是关于Microsoft Azure 认知服务 - 说话人识别 - 速率限制的主要内容,如果未能解决你的问题,请参考以下文章

Microsoft Azure 认知服务手写检测边界框参数

如何在 Python 中实现 Microsoft 说话人识别/验证 API?

“python”中是不是提供 azure 对话转录服务?

Azure 认知服务 - 使用 python 和 websockets 自定义语音

Azure 认知服务 计算机视觉API - 读取图片中的文字 (OCR)

认知服务 - 自定义语音 C++