如何使用 python 和音频文件创建自定义文本到语音?

Posted

技术标签:

【中文标题】如何使用 python 和音频文件创建自定义文本到语音?【英文标题】:How to create custom text to speech with python and audio files? 【发布时间】:2021-11-27 14:15:33 【问题描述】:

我有每个字母的音频 (mp3) 文件。我想创建自己的文本到语音。我正在使用 os.system("start D:\\letters\\a.mp3") ,但是如果我想让代码说一些单词,则只播放最后一个字母。另一种逐字母播放音频文件的方法是什么?就像文字转语音一样。

我目前在 Windows 上,但计划在 Linux 上迁移,因此需要一些此类项目所需的多平台库。谢谢。

【问题讨论】:

【参考方案1】:

我不会试图阻止你这样做。但是,您将需要整个语音字母表,以及一种将单词分解为该单词的方法。如果您只是在寻找一个只会播放单词字母的程序,您可以随时使用带有 for 循环的 VLC。

import vlc
for i in [list]
    audio = vlc.MediaPlayer("path")
    audio.play()

如果您只想使用文本转语音,那么已经有很多 API。 Google 是一个非常好的选择。 pyttx3 也不是太简陋,是一个很好的 Python 模块。

【讨论】:

以上是关于如何使用 python 和音频文件创建自定义文本到语音?的主要内容,如果未能解决你的问题,请参考以下文章

如何在不创建新文件的情况下使用 ffmpeg/avconv 更改元数据?

Vue Quill富文本自定义上传音频/视频

Vue Quill富文本自定义上传音频/视频

如何制作自定义音频格式和自定义播放器

无法在 UWP 上从文本到语音的音频创建 URI 文件

对斗破苍穹进行python文本分析