无法将语音转换为文本
Posted
技术标签:
【中文标题】无法将语音转换为文本【英文标题】:Unable to Convert Speech to Text 【发布时间】:2017-01-29 15:49:58 【问题描述】:我在使用Wit.ai 站点将简单的 MP3 文件从语音转换为文本时收到 500 错误。
我认为我发送的 WAV 格式不正确。这是我的转换:
ffmpeg -i input.mp3 -acodec pcm_s16le -ac 1 -ar 16000 input.wav
这给了我一个带有 pcm_s16le ([1][0][0][0] / 0x0001)、16000 Hz、单声道、s16、256 kb/s 的 WAV 文件
这是我的要求:
curl -X "POST" "https://api.wit.ai/speech?v=20160526" \
-H "Authorization: Bearer TOKEN_HERE" \
-H "Content-Type: audio/wav"
我在请求中将文件作为二进制内容发送。我也尝试过 MP3,但它也不起作用。知道为什么吗?
【问题讨论】:
它在网站上告诉您错误 500 是他们方面的问题。与他们(论坛/电子邮件)核实问题所在。可能是服务器问题之类的...... 【参考方案1】:最终无法处理超过 10 秒的音频文件。他们应该为此实现一个特定的 400 Bad Request,并且可能会在其中包含这个东西的响应。
【讨论】:
以上是关于无法将语音转换为文本的主要内容,如果未能解决你的问题,请参考以下文章