如何将声学的spectrogram(声谱图)重新反变换成时域语音信号

Posted nicoooolas

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何将声学的spectrogram(声谱图)重新反变换成时域语音信号相关的知识,希望对你有一定的参考价值。

最近在研究一些信号分析的事情,感兴趣如何将频谱信号反变换成时域信号。fft 与ifft可以顺畅的转变,但是这个是一帧信号,当时间较长的信号再一起是,通过反变换变成一帧一帧的时域信号,如何把他们拼接起来非常感兴趣,以后会做一些尝试,这里先留个档案。

1.将声音转化为声谱图(Spectrogram)

通过短时傅里叶变换。

2.将声谱图转换为声音

1. 通过ifft将一帧一帧的FFT信号(即1维的FFT信号数组X(F)(i)[ i=0 to length( X(f) ) ])变换成一小段一小段的时域信号,再将他们拼接起来。(加窗和overlap是否带来影响及相位是否丢失?)

 

下面打算通过labview或matlab去实现。(本来想查阅了相关资料借鉴一下,没有找到相关的资料,所以打算自己去尝试下下面的处理,如果有知道的还请告诉我相关的资料或方法,借鉴一下,谢谢)

第一步是找一个语音信号,将其转换为STFT的Spectrogram,

第二步是将他还原回去一帧一帧的声学信号,并拼接成语音信号,看语音信号是否能1. 语音是否能还原,2平滑过渡,3相位是否会丢失。(2019-12-15,完成后再来更新)

以上是关于如何将声学的spectrogram(声谱图)重新反变换成时域语音信号的主要内容,如果未能解决你的问题,请参考以下文章

了解 scipy.signal.spectrogram() 的输出

限制 scipy.signal.spectrogram 仅计算特定频率

无法理解 SciPy.signal.spectrogram 输出

如何将 Librosa 频谱图保存为特定尺寸的图像?

语谱图 Spectrogram 的定义与机理

声学模型GMM-HMM