1000页文件文本到语音

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了1000页文件文本到语音相关的知识,希望对你有一定的参考价值。

我是一个python新手,所以如果我的问题简单化或者愚蠢,我道歉。在发帖之前,我已经尝试过谷歌搜索,我保证。

我有一个非常大的文档(大约1100页),我需要一个语音转文本的MP3。我看到的所有TTS模块(GTTS等)都需要字符串,而不是文档。以下是我的核心问题。

  • 可以一次性完成吗?我必须把文档分解成小块吗?

  • Python是正确的工具吗?

  • 在下面的代码中,有什么方法可以替换掉下面的 Myfile = string 类似于 Myfile = open(mydoc.txt)?

(是的,我只是把这个从网上复制粘贴过来,但我保证我一直在自己玩。)

# to speech conversion 
from gtts import gTTS 

# This module is imported so that we can  
# play the converted audio 
import os 

# The text that you want to convert to audio 
mytext = 'Welcome to geeksforgeeks!'

# Language in which you want to convert 
language = 'en'

# Passing the text and language to the engine,  
# here we have marked slow=False. Which tells  
# the module that the converted audio should  
# have a high speed 
myobj = gTTS(text=mytext, lang=language, slow=False) 

# Saving the converted audio in a mp3 file named 
# welcome  
myobj.save("welcome.mp3") 


答案
filepath = 'test.txt'
text = ''
with open(filepath) as fp:
    line = fp.readline()
    while line:
        text += line.strip() + '
'
        line = fp.readline()

这里的代码是逐行读取文本文件,然后将其追加到'text'字符串变量中。从那里你应该可以把它加载到gTTS中。它可能需要一些时间来加载或有一个大的文件大小,但它应该工作。

以上是关于1000页文件文本到语音的主要内容,如果未能解决你的问题,请参考以下文章

python将文本转换成语音的代码

IBM Watson 语音到文本 API 中的 1006 错误代码

Curl 文本到语音中的 SSML 代码 IBM Watson

如何使用 python 和音频文件创建自定义文本到语音?

从自己的声音文件语音到文本

有没有办法将音频文件发送到语音到文本识别