使用卷积神经网络产生音频

Posted 2023-03-12

技术标签:

【中文标题】使用卷积神经网络产生音频【英文标题】：Produce Audio with Convolutional neural networks 【发布时间】：2017-06-08 15:22:11 【问题描述】：

是否有任何使用卷积神经网络生成音频的方法？

有很多通过卷积网络生成图像的方法。但我没有看到有关制作音频的文章或帖子。

根据***上的这个话题，发帖人说：

“我发现音频可以表示为频谱图。”

那为什么做不到呢？

要使用 Convnets 做到这一点，我应该：

a) 将 LSTM 与卷积层一起使用？

B) 输出应该是什么？考虑到频谱图...

【问题讨论】：

【参考方案1】：

是的，当然有，Deepmind 的 WaveNet 产生的音频非常类似于“类人”质量。它还可以生成音乐。

https://deepmind.com/blog/wavenet-generative-model-raw-audio/

【讨论】：

以上是关于使用卷积神经网络产生音频的主要内容，如果未能解决你的问题，请参考以下文章