pyspeech (python) - 转录 mp3 文件?

Posted

技术标签:

【中文标题】pyspeech (python) - 转录 mp3 文件?【英文标题】:pyspeech (python) - Transcribe mp3 files? 【发布时间】:2011-06-04 10:13:30 【问题描述】:

我想使用 pyspeech API 转录 mp3(语音转文本)。不过,我不知道这是否可能。

是吗?怎么样?

【问题讨论】:

【参考方案1】:

pyspeech 似乎只是常规 Windows 语音 API 的 python 接口。您很可能会创建一些方法,将 mp3 播放视为音频源,供该语音 API 收听。

【讨论】:

能否更详细地解释一下如何做到这一点? 另外,我有一台 Mac。这会阻止我使用 pyspeech 吗? 你必须在你的 Mac 上运行 Windows。要么直接在硬件上,要么在虚拟机中(Parallels、VMWare 等)。 MacOS 不支持 Windows API(不应该)。至于怎么做,我不知道。我不是 Win32 程序员。但由于 Windows api 旨在“收听”音频源,因此您必须以编程方式将 mp3 转换为 API 可以收听的音频设备。【参考方案2】:

我不了解 pyspeech,但如果它是围绕 Microsoft 语音 API 的 Python 包装器,那么其他一些帖子可能会有所帮助。

Microsoft Speech 引擎不需要麦克风输入。他们可以接受音频文件。

如果您要进行转录,则需要听写语法。听写语法包含在随 Windows 7 和 Vista 一起提供的 Microsoft 语音引擎的客户端版本中。 Microsoft 提供的服务器引擎上不提供听写语法。

在 C# 中使用带有 System.Speech 命名空间的听写语法的简单示例位于 *** 问题 SAPI and Windows 7 Problem

【讨论】:

以上是关于pyspeech (python) - 转录 mp3 文件?的主要内容,如果未能解决你的问题,请参考以下文章

“python”中是不是提供 azure 对话转录服务?

如何在 Python 中将 DNA 序列列表转录为 RNA

利用gff提取某个基因的最长转录本(Python实现)

python 鉴定H3k27ac峰,其与所有BLUEPRINT数据集中的启动子重叠并随后鉴定转录因子

告别「复制+粘贴」,Python 实现PDF转文本

使用Watson SDK进行连续语音到文本