Microsoft Azure 认知服务 - 说话人识别 - 速率限制
Posted
技术标签:
【中文标题】Microsoft Azure 认知服务 - 说话人识别 - 速率限制【英文标题】:Microsoft Azure cognition services - Speaker Recognition - Rate Limit 【发布时间】:2018-03-12 13:15:24 【问题描述】:我是 *** 的新手,我试图查找与我的主题的讨论是否已经存在但没有。
英语不是我的母语,我为我的错误提前道歉。
所以我会告诉你我的问题。我使用 Microsoft Azure 和认知服务来使用说话人识别 API。 我订阅了“随用随付”的标准定价层(每秒 5 次通话)。我使用 Unity 进行录音并将音频发送到服务器。
每隔 5 秒,我在 C# 脚本的更新函数中将音频发送到服务器。 但是大约 30 秒的语音,我收到了错误 429:代码:RateLimitExceeded,消息:超出了速率限制。请稍后再试。
如果有人使用它,你知道为什么我从服务器得到这个响应,而我有一个订阅来避免这个限制。
我加入了 Microsoft 助手,他们告诉我订阅有效,但我没有看到任何直接付款。
提前感谢您的帮助和建议, 梅巴德
【问题讨论】:
【参考方案1】:如果您在此处查看自述文件部分中的注释https://github.com/Microsoft/Cognitive-SpeakerRecognition-Windows,
注意:确保每分钟因调整步长而产生的请求数不会超过您订阅的速率限制。
例如,对大小为 1 分钟的音频文件应用步长 1 将导致 60 个请求。对同一个音频文件应用 2 的步长将产生 30 个请求。为方便起见,我们提供了用于注册 2 个扬声器的示例音频和用于流式传输的示例音频。这些音频位于 SpeakerRecognition\Windows\Streaming\SPIDStreamingAPI-WPF-Samples\SampleAudios 下。
另外,根据https://azure.microsoft.com/en-us/services/cognitive-services/speaker-recognition/ 上的 API 链接 音频文件格式必须满足以下要求:
-
容器 - WAV
编码 - PCM
速率 - 16K
示例格式 - 16 位
频道 - 单声道
如果有帮助,请告诉我。
【讨论】:
您好,感谢您的回复,很抱歉回复晚了。我发送的音频文件格式符合要求。我试图理解,但“步长”是什么意思?我每次发送多个 5 秒的音频文件。当我到达第六个或第七个文件时,我得到了“超出速率限制”。而且我认为订阅没有被考虑在内,但它是活跃的。 根据github readme.md,我们可以通过调整“步长”来控制每次识别请求之间的秒数。这意味着步长实际上是每个识别请求之间的秒数。希望对您有所帮助。以上是关于Microsoft Azure 认知服务 - 说话人识别 - 速率限制的主要内容,如果未能解决你的问题,请参考以下文章
如何在 Python 中实现 Microsoft 说话人识别/验证 API?
Azure 认知服务 - 使用 python 和 websockets 自定义语音