pyspeech (python) - 转录 mp3 文件?
Posted
技术标签:
【中文标题】pyspeech (python) - 转录 mp3 文件?【英文标题】:pyspeech (python) - Transcribe mp3 files? 【发布时间】:2011-06-04 10:13:30 【问题描述】:我想使用 pyspeech API 转录 mp3(语音转文本)。不过,我不知道这是否可能。
是吗?怎么样?
【问题讨论】:
【参考方案1】:pyspeech 似乎只是常规 Windows 语音 API 的 python 接口。您很可能会创建一些方法,将 mp3 播放视为音频源,供该语音 API 收听。
【讨论】:
能否更详细地解释一下如何做到这一点? 另外,我有一台 Mac。这会阻止我使用 pyspeech 吗? 你必须在你的 Mac 上运行 Windows。要么直接在硬件上,要么在虚拟机中(Parallels、VMWare 等)。 MacOS 不支持 Windows API(不应该)。至于怎么做,我不知道。我不是 Win32 程序员。但由于 Windows api 旨在“收听”音频源,因此您必须以编程方式将 mp3 转换为 API 可以收听的音频设备。【参考方案2】:我不了解 pyspeech,但如果它是围绕 Microsoft 语音 API 的 Python 包装器,那么其他一些帖子可能会有所帮助。
Microsoft Speech 引擎不需要麦克风输入。他们可以接受音频文件。
如果您要进行转录,则需要听写语法。听写语法包含在随 Windows 7 和 Vista 一起提供的 Microsoft 语音引擎的客户端版本中。 Microsoft 提供的服务器引擎上不提供听写语法。
在 C# 中使用带有 System.Speech 命名空间的听写语法的简单示例位于 *** 问题 SAPI and Windows 7 Problem
【讨论】:
以上是关于pyspeech (python) - 转录 mp3 文件?的主要内容,如果未能解决你的问题,请参考以下文章