用户说话时如何捕捉语音输入

Posted

技术标签:

【中文标题】用户说话时如何捕捉语音输入【英文标题】:how to catch voice input when user speaks 【发布时间】:2012-09-23 11:45:54 【问题描述】:

如何在用户开始说话时捕捉语音输入,就像会说话的汤姆应用程序一样。 谁能帮我 ? 我想在用户开始说话时开始语音记录,当用户停止说话时它必须停止,就像会说话的汤姆应用程序如何工作一样。有人可以帮忙吗?提前致谢。

【问题讨论】:

【参考方案1】:

您必须使用一些语音活动检测(VAD) 算法。这种信号处理的东西通常是用 C 编写的,所以你还必须学习一些关于使用NDK

【讨论】:

您可以查看以下 SO 回答 ***.com/questions/5367214/…

以上是关于用户说话时如何捕捉语音输入的主要内容,如果未能解决你的问题,请参考以下文章

通过实时语音驱动人像模拟真人说话

用户体验评价

声网Agora Lipsync技术剖析:通过实时语音驱动人像模拟真人说话

Android 语音中的关键字识别?

Kinect结合Unity基础使用(一)

数字语音识别0-9常出现的问题