


【中文标题】第一次制作波表合成器......有人能指出我正确的方向吗?【英文标题】:Making a wavetable synth for the first time...Can somebody point me in the right direction? 【发布时间】:2020-10-18 16:48:01 【问题描述】:

我第一次尝试在 Python 中制作波表合成器(基于我在此处找到的示例 https://blamsoft.com/tutorials/expanse-creating-wavetables/),但我得到的声音根本没有音调。我的输出只是一个低颗粒的嗡嗡声。我对用 Python 制作波表很陌生,我想知道是否有人可以告诉我我缺少什么以便将 A440 正弦波表写入文件“wavetable.wav”并实际拥有它产生纯正弦音?这是我目前所拥有的:

import wave
import struct
import numpy as np

frame_count = 256
frame_size = 2048
sps = 44100
freq_hz = 440
file = "wavetable.wav" #write waveform to file

wav_file = wave.open(file, 'w')
wav_file.setparams((1, 2, sps, frame_count, 'NONE', 'not compressed'))

values = bytes(0)

for i in range(frame_count):
    for ii in range(frame_size):
        sample = np.sin((float(ii)/frame_size) * (i+128)/256 * 2 * np.pi * freq_hz/sps) * 65535 
        if sample < 0:
            sample = 0
        sample -= 32768
        sample = int(sample)

        values += struct.pack('h', sample) 


print("Generated " + file)

我在 for 循环中的正弦函数可能是我理解最少的部分,因为我只是逐字逐句地看示例。我习惯于制作像 (y = Asin(2πfx)) 这样的正弦函数,但我不确定乘以 ((i+128)/256) 和 65535(16 位幅度分辨率?)的目的是什么。我也不确定从每个样本中减去 32768 的目的是什么。有没有人能够澄清我所缺少的并可能指出我正确的方向?我会以错误的方式解决这个问题吗?任何帮助表示赞赏!


如果您只是想提前生成声音数据,然后将其全部转储到一个文件中,并且您也习惯使用 NumPy,我建议将它与像 SoundFile 这样的库一起使用。这样就不需要将数据分隔成帧。

如果您只是想提前生成声音数据,然后将其全部转储到一个文件中,并且您也习惯使用 NumPy,我建议将它与像 SoundFile 这样的库一起使用。这样就不需要将数据分隔成帧。


from math import tau
import numpy as np
import soundfile as sf

file_path = 'sine.flac'
sample_rate = 48_000   # hertz
duration = 1.0         # seconds
frequency = 432.0      # hertz
amplitude = 0.8        # (not in decibels!)
start_phase = 0.0      # at what phase to start

sample_count = floor(sample_rate * duration)

# cyclical frequency in sample^-1
omega = frequency * tau / sample_rate

# all phases for which we want to sample our sine
phases = np.linspace(start_phase, start_phase + omega * sample_count,
                     sample_count, endpoint=False)

# our sine wave samples, generated all at once
audio = amplitude * np.sin(phases)

# now write to file
fmt, sub = 'FLAC', 'PCM_24'
assert sf.check_format(fmt, sub) # to make sure we ask the correct thing beforehand
sf.write(file_path, audio, sample_rate, format=fmt, subtype=sub)

这将是单声道声音,您可以使用 2d 数组编写立体声(请参阅 NumPy 和 SoundFile 的文档)。


您也可以使用类似PyAudio 的方式在 Python 中实时播放分块声音。 (我还没有使用过,所以至少在一段时间内这个答案会缺少与此相关的代码。)

最后,坦率地说,以上所有内容都与从波表生成声音数据无关:您只需从某个地方选择一个波表,这对实际合成没有多大作用。这是一个简单的启动算法。假设您要播放一大块sample_count 样本,并在wavetable 中存储一个波表,这是一个完美循环并标准化的单个周期。并假设您当前的波形相位为start_phase,频率为frequency,采样率为sample_rate,幅度为amplitude。那么:

# indices for the wavetable values; this is just for `np.interp` to work
wavetable_period = float(len(wavetable))
wavetable_indices = np.linspace(0, wavetable_period,
                                len(wavetable), endpoint=False)

# frequency of the wavetable played at native resolution
wavetable_freq = sample_rate / wavetable_period

# start index into the wavetable
start_index = start_phase * wavetable_period / tau

# code above you run just once at initialization of this wavetable ↑
# code below is run for each audio chunk ↓

# samples of wavetable per output sample
shift = frequency / wavetable_freq

# fractional indices into the wavetable
indices = np.linspace(start_index, start_index + shift * sample_count,
                      sample_count, endpoint=False)

# linearly interpolated wavetavle sampled at our frequency
audio = np.interp(indices, wavetable_indices, wavetable,
audio *= amplitude

# at last, update `start_index` for the next chunk
start_index += shift * sample_count

然后你输出音频。尽管有更好的方法来回放波表,但线性插值至少是一个好的开始。使用这种方法也可以实现频率滑动:只需以另一种方式计算 indices,不再均匀间隔。






