如何使用 python 连接两个 wav 文件?
Posted
技术标签:
【中文标题】如何使用 python 连接两个 wav 文件?【英文标题】:How to join two wav files using python? 【发布时间】:2011-02-22 20:36:33 【问题描述】:我正在使用python编程语言,我想在另一个wav文件的末尾加入一个wav文件? 我在论坛中有一个问题,建议如何合并两个 wav 文件,即在某个偏移量处添加一个 wav 文件的内容,但我想在彼此末尾加入两个 wav 文件...
而且我也有可能播放我自己的 wav 文件,使用 winsound 模块..我能够播放声音,但在播放任何 Windows 声音之前使用 time.sleep 一段时间,如果我想要的话,缺点是这样要播放更长的声音。sleep(N),N sec 也是,Windows 声音将在 N sec 播放 winsound nd 后重叠。..
任何人都可以帮忙吗?请建议如何解决这些问题...
提前致谢
【问题讨论】:
【参考方案1】:Python 附带了 wave 模块,可以满足您的需求。当文件的详细信息(单声道或立体声、帧速率等)相同时,以下示例有效:
import wave
infiles = ["sound_1.wav", "sound_2.wav"]
outfile = "sounds.wav"
data= []
for infile in infiles:
w = wave.open(infile, 'rb')
data.append( [w.getparams(), w.readframes(w.getnframes())] )
w.close()
output = wave.open(outfile, 'wb')
output.setparams(data[0][0])
for i in range(len(data)):
output.writeframes(data[i][1])
output.close()
【讨论】:
【参考方案2】:我用pysox
wave 模块和许多其他模块似乎不支持 mu-law wavs。
您安装的 pysox 请求 SoX 并更新您的 PATH 以包含它的安装目录。
import sox
cbn=sox.Combiner()
sounds=[]
#PROCESS SOUND PATHS TO AN ARRAY
if len(sounds)>=2:
print(sounds)
cbn.build(sounds,'outputfilepath.ext','concatenate')
【讨论】:
【参考方案3】:我会使用librosa.load
和librosa.write_wav
。
查看文档here
import librosa
import numpy as np
import librosa.display
example_audio = librosa.util.example_audio_file()
x, sr = librosa.load(example_audio, duration=5)
print('shape of x ==> ' + str(x.shape))
y, sr = librosa.load(example_audio, duration=5)
print('shape of y ==> ' + str(y.shape))
z = np.append(x,y)
print('shape of x+y = z ==> ' + str(z.shape))
librosa.output.write_wav('joined_file.wav', z, sr)
z_loaded, sr = librosa.load('joined_file.wav')
print('shape of z loaded ==> ' + str(z_loaded.shape))
输出:
x 的形状 ==> (110250,)
y 的形状 ==> (110250,)
x+y 的形状 = z ==> (220500,)
z 加载的形状 ==> (220500,)
【讨论】:
@Ryan 更新了答案。您可能对这里的更多代码示例感兴趣:github.com/gndps/vocal-training/blob/master/… 虽然不是很容易阅读文档 请注意librosa
附带numpy
、scipy
、scikit-learn
,这对于那些只想合并 WAV 文件的人来说可能是矫枉过正【参考方案4】:
Python 3 解决方案: 我们可以使用标准库来做到这一点,如 tom10 和 eggbert 的回答所示。 下面是一个较短的版本:
-
仅写入第一个波形文件的参数。我们可以测试 wav_out 文件长度,看看我们是否还没有写入它。如果我们没有只写一次波形参数。
然后在从 wav_in 读取帧时将帧写入 wav_out。
with wave.open(outfile, 'wb') as wav_out:
for wav_path in infiles:
with wave.open(wav_path, 'rb') as wav_in:
if not wav_out.getnframes():
wav_out.setparams(wav_in.getparams())
wav_out.writeframes(wav_in.readframes(wav_in.getnframes()))
【讨论】:
请注意,这支持合并超过2个文件,而@tom10's answer仅适用于2个文件【参考方案5】:只是以@tom10 的回答为基础:
from contextlib import closing
with closing(wave.open(outfile, 'wb')) as output:
# find sample rate from first file
with closing(wave.open(wav_files[0])) as w:
output.setparams(w.getparams())
# write each file to output
for infile in wav_files:
with closing(wave.open(infile)) as w:
output.writeframes(w.readframes(w.getnframes()))
它不是存储所有数据然后一次将其写入末尾,而是逐位写入。它还使用 contextlib.close,因此您不必关闭文件。
【讨论】:
在 python3 中,看起来我们不需要 contextlib 包装器:“open() 函数可以在 with 语句中使用。当 with 块完成时,Wave_read.close() 或Wave_write.close() 方法被调用。” docs.python.org/3/library/wave.html【参考方案6】:我是pydub 的维护者,它旨在让这类事情变得简单。
from pydub import Audiosegment
sound1 = AudioSegment.from_wav("/path/to/file1.wav")
sound2 = AudioSegment.from_wav("/path/to/file2.wav")
combined_sounds = sound1 + sound2
combined_sounds.export("/output/path.wav", format="wav")
注意:pydub 是一个轻量级的 audioop 包装器。所以在幕后,它基本上是在做 Tom10 提到的事情
【讨论】:
这令人印象深刻!谢谢。 但是如果你正在读取一个时间戳文件呢???你如何连接文件人 @Elvisjames 我认为你需要安装 ffprobe - pydub 绝对支持 python 3【参考方案7】:我使用 SOX [1] 库,然后像这样调用它
>>> import subprocess
>>> sound_output_path = /tmp
>>> sox_filenames = ['file.wav', 'file1.wav']
>>> subprocess.call(['sox'] + sox_filenames + ['%s/out.wav' % sound_output_path])
[1]http://sox.sourceforge.net/
【讨论】:
【参考方案8】:你可以使用audiolab
:
import audiolab, scipy
a, fs, enc = audiolab.wavread('file1.wav')
b, fs, enc = audiolab.wavread('file2.wav')
c = scipy.vstack((a,b))
audiolab.wavwrite(c, 'file3.wav', fs, enc)
【讨论】:
我是否需要安装任何软件包才能使用 scipy...我使用的是 python2.6,如果需要,我可以下载兼容的版本吗...请给我链接。 .我试图frm scipy网站本身bt面临sme问题..如果没有安装步骤请建议..谢谢你的回答..你知道如何播放声音吗,我提到了我的prob wit playin,任何措施fr那个?? Python 2.6 没问题,Numpy/Scipy 网站也应该没问题。我可能会让其他人回答您的问题并提供进一步的建议。虽然我的回答确实有效,但可能还有更优雅、更直接的解决方案。 我尝试从 scikits 安装 audiolab,它的大小约为 1.4 mb,并且安装成功,但是在运行你的代码时它说 import error: no module named audiolab..i didn't install the 44mb scipy包是问题,我是否还需要安装它或 audioalab 下载本身不正确 我也安装了 Scipy,但仍然说导入错误..我正在使用两个都下载并稍后安装的窗口..仍然有可能是什么原因.. 这些天,我会使用librosa
。 librosa.github.io/librosa/generated/…以上是关于如何使用 python 连接两个 wav 文件?的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 NAudio 将两个 wav 音频文件与 30 秒的白色声音连接起来