语音识别,录制的音频去哪了?

Posted

技术标签:

【中文标题】语音识别,录制的音频去哪了?【英文标题】:Speech recognition , where does the recorded audio go? 【发布时间】:2013-03-30 19:42:48 【问题描述】:

我正在开发一个语音识别应用程序,用户会说一个句子或任何东西,它会被转换成文本......(语音到文本的转换是通过谷歌发生的)

我的问题是,当这个人说话时,保存或记录他的声音(语音)的文件/缓冲区在哪里? (在 Google 接收并转换之前)

是否有可能获得这个文件或缓冲区?

【问题讨论】:

【参考方案1】:

是的,小于 4 的版本(不知道 3)位于 onBufferReceived(byte[] buffer)。在第 4 版 (ICS) 中,没有任何回报。

【讨论】:

以上是关于语音识别,录制的音频去哪了?的主要内容,如果未能解决你的问题,请参考以下文章

百度语音识别REST API完整Demo

使用语音框架 iOS 从音频文件生成字幕

鸿蒙AI能力之语音识别

带有 node.js Bot 框架的 Skype 语音识别 API

基于kaldi的iOS实时语音识别(本地)+03+音频采集传输

C# 发送 NAudio WaveOut 到 Bing 语音识别平台