1000页文件文本到语音
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了1000页文件文本到语音相关的知识,希望对你有一定的参考价值。
我是一个python新手,所以如果我的问题简单化或者愚蠢,我道歉。在发帖之前,我已经尝试过谷歌搜索,我保证。
我有一个非常大的文档(大约1100页),我需要一个语音转文本的MP3。我看到的所有TTS模块(GTTS等)都需要字符串,而不是文档。以下是我的核心问题。
可以一次性完成吗?我必须把文档分解成小块吗?
Python是正确的工具吗?
在下面的代码中,有什么方法可以替换掉下面的
Myfile = string
类似于Myfile = open(mydoc.txt)
?
(是的,我只是把这个从网上复制粘贴过来,但我保证我一直在自己玩。)
# to speech conversion
from gtts import gTTS
# This module is imported so that we can
# play the converted audio
import os
# The text that you want to convert to audio
mytext = 'Welcome to geeksforgeeks!'
# Language in which you want to convert
language = 'en'
# Passing the text and language to the engine,
# here we have marked slow=False. Which tells
# the module that the converted audio should
# have a high speed
myobj = gTTS(text=mytext, lang=language, slow=False)
# Saving the converted audio in a mp3 file named
# welcome
myobj.save("welcome.mp3")
答案
filepath = 'test.txt'
text = ''
with open(filepath) as fp:
line = fp.readline()
while line:
text += line.strip() + '
'
line = fp.readline()
这里的代码是逐行读取文本文件,然后将其追加到'text'字符串变量中。从那里你应该可以把它加载到gTTS中。它可能需要一些时间来加载或有一个大的文件大小,但它应该工作。
以上是关于1000页文件文本到语音的主要内容,如果未能解决你的问题,请参考以下文章
IBM Watson 语音到文本 API 中的 1006 错误代码