从音频文件中删除人声的算法

Posted

技术标签:

【中文标题】从音频文件中删除人声的算法【英文标题】:Algorithm to remove vocal from audio file 【发布时间】:2021-03-28 15:47:59 【问题描述】:

我知道这已经发布了more than 10 years ago,但我想相信这方面已经取得了一些进展。 (我们现在有 Deepfake,在 AI 方面取得了很大进展)。

我大胆尝试了一些教程,但对结果非常失望(公平地说,结果输出并没有那么糟糕,但对于产品来说还不够好)。

我可以使用什么信誉良好的算法来处理自己的 mp3 文件并去除人声,同时保留鼓和居中的乐器,并去除人声回声?

【问题讨论】:

您是在寻找现成的软件还是在代码中实现的算法? 我认为您可能会在dsp.stackexchange.com 或DAFX 论文例如dafx.de/paper-archive/2013/papers/40.dafx2013_submission_7.pdf 上获得最佳回复 @LeoAimone 算法实现 @fdcpp 这很有趣,但它是 2013 年的论文,从那以后就没有了? @fdcpp 谢谢,我会用 dsp 试试运气 【参考方案1】:

此任务在社区中被称为“人声源分离”或“人声信号分离”或“歌声源分离”,它们是专门的“音乐源分离”任务,也是更一般的“源分离”的示例" 任务。

这里有一些论文:Music Source Separation。 最积极开发的开源解决方案之一是Spleeter,它已在各种音频产品中商业化使用。有一个基于它的在线工具,您可以在Splitter.ai 试用。 “2 stem”版本将为您提供一首带有人声的曲目,以及一首带有其他所有内容的曲目。

【讨论】:

以上是关于从音频文件中删除人声的算法的主要内容,如果未能解决你的问题,请参考以下文章

mp3中的背景音乐和人声分离?用啥软件

短视频运营短视频剪辑 ④ ( 将文字转音频添加到视频中 | 编辑 TTS 音频信息 | 组合重叠人声音频添加 | 音频爆音处理 )

华为音频编辑服务,实时分离人声伴奏和乐器声

使用 Keras 进行音频分类:人声的存在

在iOS App(制作卡拉OK)中从音频文件中分离语音和音乐[关闭]

华为音频编辑服务,实时分离人声伴奏和乐器声