Microsoft Azure 认知服务 - 说话人识别 - 速率限制

Posted 2023-02-22

技术标签:

【中文标题】Microsoft Azure 认知服务 - 说话人识别 - 速率限制【英文标题】：Microsoft Azure cognition services - Speaker Recognition - Rate Limit 【发布时间】：2018-03-12 13:15:24 【问题描述】：

我是 *** 的新手，我试图查找与我的主题的讨论是否已经存在但没有。

英语不是我的母语，我为我的错误提前道歉。

所以我会告诉你我的问题。我使用 Microsoft Azure 和认知服务来使用说话人识别 API。我订阅了“随用随付”的标准定价层（每秒 5 次通话）。我使用 Unity 进行录音并将音频发送到服务器。

每隔 5 秒，我在 C# 脚本的更新函数中将音频发送到服务器。但是大约 30 秒的语音，我收到了错误 429：代码：RateLimitExceeded，消息：超出了速率限制。请稍后再试。

如果有人使用它，你知道为什么我从服务器得到这个响应，而我有一个订阅来避免这个限制。

我加入了 Microsoft 助手，他们告诉我订阅有效，但我没有看到任何直接付款。

提前感谢您的帮助和建议，梅巴德

【问题讨论】：

【参考方案1】：

如果您在此处查看自述文件部分中的注释https://github.com/Microsoft/Cognitive-SpeakerRecognition-Windows，

注意：确保每分钟因调整步长而产生的请求数不会超过您订阅的速率限制。

例如，对大小为 1 分钟的音频文件应用步长 1 将导致 60 个请求。对同一个音频文件应用 2 的步长将产生 30 个请求。为方便起见，我们提供了用于注册 2 个扬声器的示例音频和用于流式传输的示例音频。这些音频位于 SpeakerRecognition\Windows\Streaming\SPIDStreamingAPI-WPF-Samples\SampleAudios 下。

另外，根据https://azure.microsoft.com/en-us/services/cognitive-services/speaker-recognition/ 上的 API 链接音频文件格式必须满足以下要求：

速率 - 16K

如果有帮助，请告诉我。

【讨论】：

您好，感谢您的回复，很抱歉回复晚了。我发送的音频文件格式符合要求。我试图理解，但“步长”是什么意思？我每次发送多个 5 秒的音频文件。当我到达第六个或第七个文件时，我得到了“超出速率限制”。而且我认为订阅没有被考虑在内，但它是活跃的。根据github readme.md，我们可以通过调整“步长”来控制每次识别请求之间的秒数。这意味着步长实际上是每个识别请求之间的秒数。希望对您有所帮助。

以上是关于Microsoft Azure 认知服务 - 说话人识别 - 速率限制的主要内容，如果未能解决你的问题，请参考以下文章

Microsoft Azure 认知服务手写检测边界框参数

如何在 Python 中实现 Microsoft 说话人识别/验证 API？

“python”中是不是提供 azure 对话转录服务？

Azure 认知服务 - 使用 python 和 websockets 自定义语音

Azure 认知服务计算机视觉API - 读取图片中的文字 (OCR)

认知服务 - 自定义语音 C++