说话人识别和响应时间?

Posted

技术标签:

【中文标题】说话人识别和响应时间?【英文标题】:Speaker Recognition and Response Time? 【发布时间】:2016-12-07 14:22:05 【问题描述】:

我知道说话人识别处于预览阶段,唯一可用的位置是西海岸,我希望这就是我看到这种“延迟”的原因。

我在东海岸(纽约),我的搜索中只有 3 位发言者,需要 6 秒才能返回确认信息。不要误会我的意思,6 秒的效果令人印象深刻,但如此长的延迟使得用例比更快的回复更有限。

主要问题是 - 一旦服务将位置添加得更近,我是否应该看到更快的回复? (它不像延迟应该导致一个大问题......) - 或者还有什么可以加快回复速度 - 或者,当然,这只是“它的方式”??

谢谢!

【问题讨论】:

【参考方案1】:

我假设你说的是Microsoft Speaker Recognition。

处理时间是音频长度的函数。对于 15 秒的音频,您可以预期不到 1 秒的延迟,是的,一般来说,当服务扩展到更近的位置时,您应该会看到更快的响应。

【讨论】:

以上是关于说话人识别和响应时间?的主要内容,如果未能解决你的问题,请参考以下文章

“说话人识别和分割”[关闭]

使用 Microsoft Cognitive 进行实时说话人识别

说话人识别概述

如何在 Python 中实现 Microsoft 说话人识别/验证 API?

Microsoft Azure 认知服务 - 说话人识别 - 速率限制

如何在 C# 中使用 Azure 说话人识别 API?