无法将语音转换为文本

Posted

技术标签:

【中文标题】无法将语音转换为文本【英文标题】:Unable to Convert Speech to Text 【发布时间】:2017-01-29 15:49:58 【问题描述】:

我在使用Wit.ai 站点将简单的 MP3 文件从语音转换为文本时收到 500 错误。

我认为我发送的 WAV 格式不正确。这是我的转换:

ffmpeg -i input.mp3 -acodec pcm_s16le -ac 1 -ar 16000 input.wav

这给了我一个带有 pcm_s16le ([1][0][0][0] / 0x0001)、16000 Hz、单声道、s16、256 kb/s 的 WAV 文件

这是我的要求:

curl -X "POST" "https://api.wit.ai/speech?v=20160526" \
     -H "Authorization: Bearer TOKEN_HERE" \
     -H "Content-Type: audio/wav"

我在请求中将文件作为二进制内容发送。我也尝试过 MP3,但它也不起作用。知道为什么吗?

【问题讨论】:

它在网站上告诉您错误 500 是他们方面的问题。与他们(论坛/电子邮件)核实问题所在。可能是服务器问题之类的...... 【参考方案1】:

最终无法处理超过 10 秒的音频文件。他们应该为此实现一个特定的 400 Bad Request,并且可能会在其中包含这个东西的响应。

【讨论】:

以上是关于无法将语音转换为文本的主要内容,如果未能解决你的问题,请参考以下文章

如何将语音转换为文本?

使用 SAPI 将语音转换为文本

语音到文本的转换

IBM 语音转文本 - 如何将 MP3 音频文件转换为字节数组

win10 uwp 选择文本转语音的机器人

使用 Swift 分析录制的音频文件以将语音转换为文本