无法将语音转换为文本

Posted 2023-02-25

技术标签:

【中文标题】无法将语音转换为文本【英文标题】：Unable to Convert Speech to Text 【发布时间】：2017-01-29 15:49:58 【问题描述】：

我在使用Wit.ai 站点将简单的 MP3 文件从语音转换为文本时收到 500 错误。

我认为我发送的 WAV 格式不正确。这是我的转换：

ffmpeg -i input.mp3 -acodec pcm_s16le -ac 1 -ar 16000 input.wav

这给了我一个带有 pcm_s16le ([1][0][0][0] / 0x0001)、16000 Hz、单声道、s16、256 kb/s 的 WAV 文件

这是我的要求：

curl -X "POST" "https://api.wit.ai/speech?v=20160526" \
     -H "Authorization: Bearer TOKEN_HERE" \
     -H "Content-Type: audio/wav"

我在请求中将文件作为二进制内容发送。我也尝试过 MP3，但它也不起作用。知道为什么吗？

【问题讨论】：

它在网站上告诉您错误 500 是他们方面的问题。与他们（论坛/电子邮件）核实问题所在。可能是服务器问题之类的...... 【参考方案1】：

最终无法处理超过 10 秒的音频文件。他们应该为此实现一个特定的 400 Bad Request，并且可能会在其中包含这个东西的响应。

【讨论】：

以上是关于无法将语音转换为文本的主要内容，如果未能解决你的问题，请参考以下文章