使用 Julia 在声音上使用 fft

Posted

技术标签:

【中文标题】使用 Julia 在声音上使用 fft【英文标题】:Use of fft on sound using Julia 【发布时间】:2019-05-10 17:59:00 【问题描述】:

我刚刚在 Julia 中有一些代码:

using FFTW
using Plots
using WAV, PlotlyJS

snd, sampFreq = wavread("input.wav")

N, _ = size(snd)
t = 0:1/(N-1):1;
s = snd[:,1]

y = fft(s)

y1 = copy(y)
for i = 1:N
    if abs(y1[i]) > 800
        y1[i] = 0
    end
end

s_new = real(ifft(y1))
wavwrite(s_new, "output1.wav", Fs = sampFreq)

y2 = copy(y)
for i = 1:N
    if abs(y2[i]) <  800
        y2[i] = 0
    end
end

s_new = real(ifft(y2))
wavwrite(s_new, "output2.wav", Fs = sampFreq)

sticks((abs.(y1)))
sticks!((abs.(y2)))

s1,k1 = wavread("output1.wav")
s2,k2 = wavread("output2.wav")

for i = 1:N
    s1[i] += s2[i]
end

wavwrite(s1, "output3.wav", Fs = sampFreq)

这是读取文件input.wav的代码,接下来对声音进行fft,将其分为两个文件output1,频率> 800,output2,频率

在下一部分中,我将两个文件合并到 output3 中。我期待类似于输入的东西,但我得到的声音听起来很糟糕(我的意思是它听起来像输入,但比预期的更安静,嗡嗡声更大)。

我的问题是我在代码的哪一部分丢失了有关输入的最多信息,这是一种改进它的方法,以得到与输入几乎相似的输出3?

【问题讨论】:

【参考方案1】:

您似乎不明白 fft(快速傅立叶变换)返回的内容。它返回一个幅度向量,而不是频率。矢量的分量对应于正弦波的幅度,您可以使用 fftfreq() 函数找到该频率,但请务必为 fftfreq() 函数提供其第二个参数,即您的 sampFreq 变量。

然后,要分解声音,您需要根据 fftfreq() 告诉您与 bin 对应的频率(fft() 返回的向量中的向量位置)将不需要的向量分量归零。

如果使用 ifft 反转该过程,您仍然会看到音质大幅下降,因为 fft 基本上会通过将信号拆分到频率维度的 bin 中来平均信号的各个部分。

在您进一步修复代码之前,我建议您先阅读有关 fft() 的教程——您可以在 Google 上搜索其中的几个。

【讨论】:

以上是关于使用 Julia 在声音上使用 fft的主要内容,如果未能解决你的问题,请参考以下文章

Julia 中的声音激活录音

声音 FFT 频率

如何在 iOS 中使用 vDSP 将声音文件转换为 FFT

swift 3 FFT获取声音m4a的频率

如何正确 FFT 声音阵列?

FFT算法得到错误的声音频率值