已知转录本的 Google 语音识别时间戳

Posted

技术标签:

【中文标题】已知转录本的 Google 语音识别时间戳【英文标题】:Google Speech Recognition Timestamps for Known Transcript 【发布时间】:2020-04-25 00:18:44 【问题描述】:

我有一个音频文件,并且我有该音频文件的准确抄本。我希望能够获得该特定成绩单中每个单词的时间戳

想要不准确识别语音的时间戳。我已经可以做到了,它很有用,但是由于语音识别的错误,它还不够好。

有人知道谷歌语音识别是否可以做到这一点?

【问题讨论】:

【参考方案1】:

Google 语音识别无法做到这一点。您必须使用其他服务。甚至还有开源工具。

【讨论】:

以上是关于已知转录本的 Google 语音识别时间戳的主要内容,如果未能解决你的问题,请参考以下文章

Keras深度学习实战(41)——语音识别

sphinx4 中的语音识别响应很差

Microsoft 语音识别结果的格式(挪威语)

Android中语音识别使用的比较:按意图还是线程?

收藏 | 纽约大学最新《语音识别Speech Recognition》

语音识别会引发未知值错误