python实现给视频添加字幕,并根据字幕添加语音

Posted ycc阳

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python实现给视频添加字幕,并根据字幕添加语音相关的知识,希望对你有一定的参考价值。

文章目录


前言

最近尝试用python实现给一个视频添加字幕和语音,查了很多博客后有了一个拼拼凑凑的方法:

  1. 使用"pyttsx3"来实现“文字到音频”的转换;
  2. 使用"pydub"来对得到的音频进行加工和处理;
  3. 使用"moviepy"来合成字幕和语音文件。

(注:本篇仅作为个人小白的学习记录)


一、"pyttsx3"实现“文字到音频”的转换

pyttsx3是一个很方便的实现从“文字”到“语音”的库,安装和使用都很简单,windows下安装只需要:

	pip install pyttsx3

如果要简单实现“文字段”的语音播放也很简单:

import pyttsx3
#	语音模块初始化
engine = pyttsx3.init()
#	设置要播报的字符串
text = "哈哈哈哈哈哈"
engine.say(text)
#	等待运行
engine.runAndWait()

还可以在这基础上将音频文件保存下来:

outFile = "output.aiff"
engine.save_to_file(text, outFile)
#	注意下面这句不能少,否则无法正常生成音频文件
engine.runAndWait()

这里需要注意的一点是,使用pyttsx3能够将文字转为音频,但是其编码格式特殊,保存下来的文件也是"aiff"格式的音频文件,所以如果要使用"MP3"格式则需要pydub中的Audiosegment模块来对其进行更改:

AudioSegment.from_file(outFile).export("Python.mp3", format="mp3")

当然,我也尝试了强行利用“save_to_file”将文件保存为“MP3”格式,虽然能够正常播放,但是这个文件是存在问题的(比如后面使用pydub进行处理的时候会因为无法读入而报错)

参考博客:https://blog.csdn.net/qq_19394437/article/details/97567298?spm=1001.2014.3001.5506

二、"pydub"处理音频

1.安装

pip install pydub

安装完pydub之后还需要安装ffmpeg,可以选择去github下载安装包,我这里给出网盘分享(某位老哥分享了网盘链接,我找不到原文链接了抱歉)

链接: https://pan.baidu.com/s/1dsE8p9YL-ji48Mg0vTfaMA
提取码: irxi

解压后在bin文件夹下有以下三个文件:

复制bin文件路径,添加到环境变量中,然后在cmd窗口运行如下命令:

ffmpeg -version

若正常输出则代表安装完了

(当然这里安装完了,在后面实际使用的时候还可能会出问题)

2.测试

from pydub import AudioSegment

#	读入MP3音频文件
audio = AudioSegment.from_mp3('Python.mp3')

#	简单加一段空白(静音)片段
X = 2000	#ms
silent = AudioSegment.silent(duration=X)
new_audio = silent + audio

#	保存文件
new_audio.export("new_Python.mp3", format="mp3")

代码运行到这里一般都会报错,类似于"RuntimeWarning: Couldn’t find ffmpeg or avconv - defaulting to ffmpeg, but may not work warn(“Couldn’t find ffmpeg or avconv - defaulting to ffmpeg, but may not work”, RuntimeWarning)”,或者是"RuntimeWarning: Couldn’t find ffprobe or …"

我也不知道具体为什么,可能是因为环境路径的问题?
直接给出解决办法:

报错应该会给一个"pydub"中的一个叫“utils.py”文件的路径,
第一步:找到该文件
第二步:找到一个叫"which(program)"的函数
第三步:添加前面下载的"ffmpeg"的“bin”文件路径
第四步:重启电脑

补充(第三步实例):

重启后应该能够正常运行了。

三、“moviepy”合成字幕和音频

1.安装

pip install moviepy
#	实际上安装moviepy的时候会自动安装下面两个库
pip install imageio
pip install imageio-ffmpeg

另外需要单独安装ImageMagick软件并添加到环境变量中

2.测试

from moviepy.editor import *

def videocaption(src_mp4, dst_mp4, dottemp):
    # input:
    #   src_mp4: the path of wait-to-dispose video
    #   dst_mp4: the path of after-dispose video
    #	dottemp--字幕列表['text1','text2','text3',...]
    
    #	加载视频
    video = VideoFileClip(src_mp4)

    # 逐句添加字幕
    time = [2,2,2,...]	#	字幕持续时间,自行设置
    start = [4,6,8,10,...]	#	字幕开始时间,自行设置
    position = ['bottom','center',...]	#	显示位置,自行设置
    
    txts = []
    for si,sentence in enumerate(dottemp):
    	txt = (TextClip(sentence, fontsize=40,
    					font='SimHei', size=(1900, 40),
              			align='center', color='red')
             .set_position(position[si])
             .set_duration(time[si]).set_start(start[si]))
        txts.append(txt)

    # 合成字幕
    video = CompositeVideoClip([video, *txts])
    # 合成音频
    videos = video.set_audio(AudioFileClip('Python.mp3'))
    # 保存视频,注意加上参数audio_codec='aac',否则音频无声音
    videos.write_videofile(dst_mp4, audio_codec='aac')

if __name__ == '__main__':
    #	输入输出路径
    src_mp4 = r'input.mp4'
    dst_mp4 = r'output.mp4'
    #	字幕列表
    dottemp = ['test1','test2','test3']
    #	合成视频
    videocaption(src_mp4,dst_mp4,dottemp)

代码可能会有点问题,自行调试修改

参考博客:https://blog.csdn.net/dongfuguo/article/details/104939046?spm=1001.2014.3001.5506


总结

新手上路,小心谨慎,收获良多。

python之 ffmpeg给mp4视频添加字幕

目录

ffmpeg给mp4视频加字幕

 执行结果:


ffmpeg给mp4视频加字幕

前期输入准备:

  • mp4视频
  • 外挂字幕:是一个单独的外部字幕文件,格式类型一般有srt、vtt、ass等等。播放视频时,需要把外挂字幕和视频放在同一目录下,并在播放器中选择字幕文件才可以在视频中看到字幕。

     在网上找了一个外部字幕文件,可以参考这个:https://i0.hdslb.com/bfs/subtitle/e837950453ea3e4f6e81a5709449af173d2604dc.json

输出:

  • mp4视频

(1)前期需要准备一个mp4视频,

(2)也可以运行下列代码生成外部字幕文件srt格式的,

补充:比较流行的文本字幕有srt、smi、ssa,因为是文本格式,所以就比较小了,一般大不过百来k。其中srt文本字幕最为流行,因为其制作规范简单,一句时间代码+一句字幕,使得制作修改就相当简单。配合上.style文件还能让srt自带一些字体上的特效等。几种文本字幕可以互相转换。文本字幕一般通过对图形字幕进行OCR或者手工制作生成,OCR英文字幕不难,毕竟英文识别难度小嘛,OCR中文难度就大一些,所用的软件个头也不小(SubOCR,

30多MB)。

SRT文件属于视频字幕文件,用户可以使用记事本打开查看,如果需要编辑字幕,SRT文件打开后,可以看到主要包括:数字、时间、字幕文本以及空行组成,简单了解即可。

def s2hms(x):  # 把秒转为时分秒
    m, s = divmod(x, 60)
    h, m = divmod(m, 60)
    hms = "%02d:%02d:%s" % (h, m, str('%.3f' % s).zfill(6))
    hms = hms.replace('.', ',')  # 把小数点改为逗号
    return hms


sub_content = ["from": 0, "to": 3.39, "location": 2,
                "content": "在本视频中"]
with open('1.srt', 'w') as f:
    write_content = []
    for n, i in enumerate(sub_content):  # 序号+开始-->结束+内容
        write_content.append(
            str(n + 1) + '\\n' + s2hms(i['from']) + ' --> ' + s2hms(i['to']) + '\\n' + i['content'] + '\\n\\n')
    f.writelines(write_content)

执行结果:

 外部字幕文件1.srt打开之后,是这样的:

 (3) 运行下列代码来对视频添加外部字幕文件里的字幕,

import subprocess

cmdLine = 'ffmpeg -i a.mp4 -vf subtitles=1.srt output.mp4'
subprocess.call(cmdLine, shell=True)

 执行结果:

 打开output.mp4,就可以看到我们添加的字幕了,

 

OK。

以上是关于python实现给视频添加字幕,并根据字幕添加语音的主要内容,如果未能解决你的问题,请参考以下文章

python之 ffmpeg给mp4视频添加字幕

ffmpeg 给视频添加字幕,在视频的某个时间段加入声音特效和动画

怎么把字幕放到电影里 把字幕嵌入视频

php使用ffmpeg向视频中添加文字字幕

vue怎么加滚动字幕

vue怎么加滚动的字幕