pyspeech (python) - 转录 mp3 文件？

Posted 2023-04-19

技术标签:

【中文标题】pyspeech (python) - 转录 mp3 文件？【英文标题】：pyspeech (python) - Transcribe mp3 files? 【发布时间】：2011-06-04 10:13:30 【问题描述】：

我想使用 pyspeech API 转录 mp3（语音转文本）。不过，我不知道这是否可能。

是吗？怎么样？

【问题讨论】：

【参考方案1】：

pyspeech 似乎只是常规 Windows 语音 API 的 python 接口。您很可能会创建一些方法，将 mp3 播放视为音频源，供该语音 API 收听。

【讨论】：

能否更详细地解释一下如何做到这一点？另外，我有一台 Mac。这会阻止我使用 pyspeech 吗？你必须在你的 Mac 上运行 Windows。要么直接在硬件上，要么在虚拟机中（Parallels、VMWare 等）。 MacOS 不支持 Windows API（不应该）。至于怎么做，我不知道。我不是 Win32 程序员。但由于 Windows api 旨在“收听”音频源，因此您必须以编程方式将 mp3 转换为 API 可以收听的音频设备。【参考方案2】：

我不了解 pyspeech，但如果它是围绕 Microsoft 语音 API 的 Python 包装器，那么其他一些帖子可能会有所帮助。

Microsoft Speech 引擎不需要麦克风输入。他们可以接受音频文件。

如果您要进行转录，则需要听写语法。听写语法包含在随 Windows 7 和 Vista 一起提供的 Microsoft 语音引擎的客户端版本中。 Microsoft 提供的服务器引擎上不提供听写语法。

在 C# 中使用带有 System.Speech 命名空间的听写语法的简单示例位于 *** 问题 SAPI and Windows 7 Problem

【讨论】：

以上是关于pyspeech (python) - 转录 mp3 文件？的主要内容，如果未能解决你的问题，请参考以下文章

“python”中是不是提供 azure 对话转录服务？

如何在 Python 中将 DNA 序列列表转录为 RNA

利用gff提取某个基因的最长转录本（Python实现）

python 鉴定H3k27ac峰，其与所有BLUEPRINT数据集中的启动子重叠并随后鉴定转录因子

告别「复制+粘贴」，Python 实现PDF转文本

使用Watson SDK进行连续语音到文本