为自定义语言设计 TTS(文本到语音)系统的工具包?

Posted

技术标签:

【中文标题】为自定义语言设计 TTS(文本到语音)系统的工具包?【英文标题】:Toolkits to design a TTS (Text-to-speech) system for a custom language? 【发布时间】:2014-03-26 14:11:00 【问题描述】:

我想为美国本土语言 (wayuunaiki) 创建一个 TTS 系统。 该语言是用拉丁(西方)字母书写的。 我也有关于语音的信息(将每个单词转换成国际音标符号的规则)。

我打算创建一个本地人的录音数据库。然后我想以某种方式训练该数据,使用 IPA 等效信息生成更准确的语音模型。

我对自然语言处理完全陌生,所以我的问题是……我可以使用哪些工具来执行我的计划?

我听说 HTK 和 CMU Sphinx 在语音识别方面相当出色。不知道语音生成。也听说过 Festival,但我读到它只使用预定义的最知名的语言:英语、西班牙语等。

请原谅我的打字错误。我还在学英语。提前致谢!

【问题讨论】:

【参考方案1】:

您可以在 Festival 中添加新语言,它实际上是专门为简化新语言创建而设计的。有关更多详细信息,请阅读 festvox 书:

http://festvox.org/bsv/

另一个需要考虑的工具包是 OpenMary,也可以查看他们的文档

https://github.com/marytts/marytts/wiki/New-Language-Support

它更现代,对您来说可能更容易。

无论如何,您都必须花一些时间编写代码来描述您的语言。通常它是大约 300 行代码。之后,您可以记录单说话人 TTS 数据库并运行语音构建过程。记录的越多,结果就会越好。

【讨论】:

【参考方案2】:

使用 Festival 工具包进行文本转语音(提示:使用 Linux 操作系统)

【讨论】:

以上是关于为自定义语言设计 TTS(文本到语音)系统的工具包?的主要内容,如果未能解决你的问题,请参考以下文章

Android TextToSpeech TTS中文文本转语音(语音合成)

Android TextToSpeech TTS中文文本转语音(语音合成)

Python + edge-tts:一行代码,让你的文本轻松变成语音!

统计参数语音合成的初学者指南

语音合成模块 文本转TTS 真人发音 SYN6288

毕设题目汇总