从音频文件中删除人声的算法

Posted 2023-02-25

技术标签:

【中文标题】从音频文件中删除人声的算法【英文标题】：Algorithm to remove vocal from audio file 【发布时间】：2021-03-28 15:47:59 【问题描述】：

我知道这已经发布了more than 10 years ago，但我想相信这方面已经取得了一些进展。（我们现在有 Deepfake，在 AI 方面取得了很大进展）。

我大胆尝试了一些教程，但对结果非常失望（公平地说，结果输出并没有那么糟糕，但对于产品来说还不够好）。

我可以使用什么信誉良好的算法来处理自己的 mp3 文件并去除人声，同时保留鼓和居中的乐器，并去除人声回声？

【问题讨论】：

您是在寻找现成的软件还是在代码中实现的算法？我认为您可能会在dsp.stackexchange.com 或DAFX 论文例如dafx.de/paper-archive/2013/papers/40.dafx2013_submission_7.pdf 上获得最佳回复 @LeoAimone 算法实现 @fdcpp 这很有趣，但它是 2013 年的论文，从那以后就没有了？ @fdcpp 谢谢，我会用 dsp 试试运气 【参考方案1】：

此任务在社区中被称为“人声源分离”或“人声信号分离”或“歌声源分离”，它们是专门的“音乐源分离”任务，也是更一般的“源分离”的示例" 任务。

这里有一些论文：Music Source Separation。最积极开发的开源解决方案之一是Spleeter，它已在各种音频产品中商业化使用。有一个基于它的在线工具，您可以在Splitter.ai 试用。 “2 stem”版本将为您提供一首带有人声的曲目，以及一首带有其他所有内容的曲目。

【讨论】：

以上是关于从音频文件中删除人声的算法的主要内容，如果未能解决你的问题，请参考以下文章

mp3中的背景音乐和人声分离？用啥软件

短视频运营短视频剪辑 ④ ( 将文字转音频添加到视频中 | 编辑 TTS 音频信息 | 组合重叠人声音频添加 | 音频爆音处理 )

华为音频编辑服务，实时分离人声伴奏和乐器声

使用 Keras 进行音频分类：人声的存在

在iOS App（制作卡拉OK）中从音频文件中分离语音和音乐[关闭]

华为音频编辑服务，实时分离人声伴奏和乐器声