使用卷积神经网络产生音频

Posted

技术标签:

【中文标题】使用卷积神经网络产生音频【英文标题】:Produce Audio with Convolutional neural networks 【发布时间】:2017-06-08 15:22:11 【问题描述】:

是否有任何使用卷积神经网络生成音频的方法?

有很多通过卷积网络生成图像的方法。但我没有看到有关制作音频的文章或帖子。

根据***上的这个话题,发帖人说:

“我发现音频可以表示为频谱图。”

那为什么做不到呢?

要使用 Convnets 做到这一点,我应该:

a) 将 LSTM 与卷积层一起使用?

B) 输出应该是什么?考虑到频谱图...

【问题讨论】:

【参考方案1】:

是的,当然有,Deepmind 的 WaveNet 产生的音频非常类似于“类人”质量。它还可以生成音乐。

https://deepmind.com/blog/wavenet-generative-model-raw-audio/

【讨论】:

以上是关于使用卷积神经网络产生音频的主要内容,如果未能解决你的问题,请参考以下文章

用于音频的卷积神经网络(CNN)[关闭]

卷积神经网络的输入数据

深度学习100例 | 第41天-卷积神经网络(CNN):UrbanSound8K音频分类(语音识别)

CNN卷积神经网络学习

34-卷积神经网络(Conv)

卷积神经网络和深度神经网络的区别是啥