如何从音频文件中隔离语音？ [关闭]

Posted 2023-02-25

技术标签:

【中文标题】如何从音频文件中隔离语音？ [关闭]【英文标题】：How to isolate voice from audio file? [closed] 【发布时间】：2015-04-22 12:40:25 【问题描述】：

我正在编写一个软件来比较两位歌手的歌唱能力。首先，用户添加来自原歌手的原创音乐文件。然后，软件必须自动将声音与音频隔离，然后将其与用户录制的音频进行比较。

到目前为止，我无法找到使用这种 FFT 方法隔离声音的来源或任何其他工具。

【问题讨论】：

用乐器将声音从录音中分离出来是高等科学，我认为不可能。没有办法决定哪个属于声音，哪个属于某些乐器。您可以过滤语音的典型频率（使用 FFT），但您也会获得乐器在此频率范围内产生的所有噪声。进一步的一切都是火箭科学。而用两个音频文件“比较歌唱能力”，似乎就更加火箭科学了。所以除非你是研究机构的天才黑客，否则我认为你会迷路。你是说我不能比较两个文件的声音吗？因为我应该尽快提交这个项目，我需要以某种方式比较这两个声音并显示音高相似度的百分比我不认识你，也不知道你能不能做到。但是您的问题让我假设您不是音频信号处理方面的专家和研究人员。我所知道的市场上最接近的东西是游戏机的 Singstar 游戏。但据我所知，它唯一能做的就是根据您唱歌的麦克风的频率计算音高，并将其与歌曲该时间点的预期数据进行比较。我认为最简单的方法是拥有两个只有声音的音频。然后你可以用 FFT 处理它们，也许计算每毫秒的音高并比较两个数据。也许这会有所帮助：en.wikipedia.org/wiki/Pitch_detection_algorithm 或查看此搜索的其他结果：google.de/… 你是对的。我不是音频信号专家。我更像是一名业务应用程序开发人员和分析师。这就是为什么我如此努力地挣扎 【参考方案1】：

有多种方法可以在音频中分离不同的声音，但它们可能非常棘手，并且需要大量有关数字信号处理的知识。

实际上，Alan Openheimer 博士在他关于数字信号处理的麻省理工学院系列讲座中演示了您所说的一个示例。（视频中大约 9 点 50 分）如果您认真对待这样做，那么浏览他的视频非常有用。

https://www.youtube.com/watch?v=rkvEM5Y3N60

我能给你的最好的东西可能是约克大学的研究，他们在这方面做了很多工作。如果您浏览他们的一些论文，您应该会找到一些如何实现这一目标的示例。

http://www-users.york.ac.uk/~jes1/Audio_Signal_Processing_Research_Demos1.html

希望对您有所帮助。

【讨论】：

有SDK或者API什么的吗？ @cegprakash 这很有趣:)

以上是关于如何从音频文件中隔离语音？ [关闭]的主要内容，如果未能解决你的问题，请参考以下文章

关闭并重新打开我的应用程序后无法从 URI 播放音频

比较两个音频文件。声音匹配[关闭]

音频设备图形隔离怎么回事

如何使用 ffmpeg 从 MPEG-4 文件中提取音频 [关闭]

使用 Google Speech to Text API 从 Web 应用程序中的麦克风捕获实时音频 [关闭]

从服务器 Android 播放音频文件 [关闭]