说话人识别和响应时间?
Posted
技术标签:
【中文标题】说话人识别和响应时间?【英文标题】:Speaker Recognition and Response Time? 【发布时间】:2016-12-07 14:22:05 【问题描述】:我知道说话人识别处于预览阶段,唯一可用的位置是西海岸,我希望这就是我看到这种“延迟”的原因。
我在东海岸(纽约),我的搜索中只有 3 位发言者,需要 6 秒才能返回确认信息。不要误会我的意思,6 秒的效果令人印象深刻,但如此长的延迟使得用例比更快的回复更有限。
主要问题是 - 一旦服务将位置添加得更近,我是否应该看到更快的回复? (它不像延迟应该导致一个大问题......) - 或者还有什么可以加快回复速度 - 或者,当然,这只是“它的方式”??
谢谢!
【问题讨论】:
【参考方案1】:我假设你说的是Microsoft Speaker Recognition。
处理时间是音频长度的函数。对于 15 秒的音频,您可以预期不到 1 秒的延迟,是的,一般来说,当服务扩展到更近的位置时,您应该会看到更快的响应。
【讨论】:
以上是关于说话人识别和响应时间?的主要内容,如果未能解决你的问题,请参考以下文章
使用 Microsoft Cognitive 进行实时说话人识别
如何在 Python 中实现 Microsoft 说话人识别/验证 API?