使用语音框架 iOS 从音频文件生成字幕

Posted

技术标签:

【中文标题】使用语音框架 iOS 从音频文件生成字幕【英文标题】:Generating Subtitles from audio file using speech Framework iOS 【发布时间】:2016-07-25 10:31:34 【问题描述】:

在我的应用程序中,我在 AvPlayer 的帮助下使用 url 播放音频。现在我想在其中添加对字幕的支持。 ios 10 引入了Speech framework,它可以帮助我们识别实时和录制的语音。按照苹果的说法:

“您可以对实时和录制的音频执行语音转录。例如,您可以获取语音识别器并使用以下代码开始简单的语音识别:

let recognizer = SFSpeechRecognizer()
let request = SFSpeechURLRecognitionRequest(url: audioFileURL)
recognizer?.recognitionTask(with: request, resultHandler:  (result, error) in
     print (result?.bestTranscription.formattedString)
)

现在我正在寻找如何使用此语音框架以当前播放音频的字符串形式获取字幕。以及如何知道当前正在播放哪个对话,以便在屏幕上显示完全相同的字符串。

【问题讨论】:

【参考方案1】:

在 SFSpeechRecognition 的片段部分,您可以选择性地识别您想要的字幕。为此,您需要通过突出显示特定文本的过滤器来解析段。

【讨论】:

以上是关于使用语音框架 iOS 从音频文件生成字幕的主要内容,如果未能解决你的问题,请参考以下文章

python实现给视频添加字幕,并根据字幕添加语音

在 iOS 中录制语音时如何以编程方式生成音频波形?

最长支持5小时,实时语音转写,直播也能同步字幕

为 iOS 应用程序使用音频文件或文本转语音

使用 Swift 分析录制的音频文件以将语音转换为文本

如何禁用 AVPlayerViewController 中的音频和字幕设置