开源音频模式识别（指纹）[关闭]

Posted 2023-03-12

技术标签:

【中文标题】开源音频模式识别（指纹）[关闭]【英文标题】：Open source audio pattern recognition (finger printing) [closed] 【发布时间】：2011-09-10 06:46:00 【问题描述】：

是否有任何开源音频指纹识别解决方案提供“类似 Shazam”的解决方案？

Shazam 使用来自Landmark digital 的商业解决方案，但我正在寻找替代的（即使准确性和性能较差）开源解决方案。

任何人都知道这样的实现，甚至是公布的未实现的算法吗？

【问题讨论】：

【参考方案1】： echoprint 看起来是商业库的可靠替代品。

用于语音识别：

CMUSphinx OpenEars

我们只测试了 echoprint，到目前为止还不错。

我知道答案有点晚了，但随着这个页面在谷歌中弹出，我们不妨随着时间的推移改进它:)

编辑为 CMU 是面向语音的

【讨论】：

语音识别：en.wikipedia.org/wiki/List_of_speech_recognition_software echoprint url 损坏网址已更新。谢谢@SarveshMishra【参考方案2】：

如果您正在 .NET 中寻找解决方案，请查看 SoundFingerprinting 库。

它是开源的，并建立在 Content Fingerprinting Using Wavelets 研究论文之上。

该算法与 Shazaam 的算法不同，但总体思路相似：从频谱中提取最显着的系数，然后使用它们构建指纹以供以后检索。

算法说明见here。

【讨论】：

你知道我们怎样才能使用SQL server作为永久存储吗？【参考方案3】：

如果您正在寻找 JAVA 库，请选择 MusicG，我在我过去的一个项目中使用过它，并且工作正常。 http://code.google.com/p/musicg/

【讨论】：

【参考方案4】：

那里有一些开源音频识别项目，尽管您可以忘记商业音频识别服务（如 Shazam、SoundHound 等）的质量/性能。这还取决于您想要进行哪种识别（音频文件指纹/标记、实时识别、OTA（Over-The-Air）识别等）

打开界面

AcoustID/MusicBrainz 提供执行音频指纹识别和元数据关联（指纹和服务器）的工具。您可以建立自己的指纹/元数据服务器或使用 MusicBrainz 的服务。音频文件指纹和识别的良好解决方案，不适用于实时高性能应用程序（即OTA）。我们也对它进行了音频流监控（广播监控）的测试，但结果很差。

Echoprint 提供与 AcoustID 相同的工具（指纹和服务器+元数据），也可用于音频流监控，因为它可以准确识别从音频中任何位置获取的 sn-ps（但我不会将它用于严肃的商业应用）。他们还声称它适合 OTA 应用，但性能不适合生产用途。

Last.fm 不是完全开源的，尽管他们已经开源了指纹模块。您必须查询他们的标识和元数据提供者服务，因为他们不提供完整的解决方案。

【讨论】：

【参考方案5】：

好的。不同的搜索关键字，我寻找的所有结果。

http://musicbrainz.org/doc/Audio_Fingerprint

感谢大家观看

【讨论】：

以上是关于开源音频模式识别（指纹）[关闭]的主要内容，如果未能解决你的问题，请参考以下文章

指纹模式识别算法源码及其测试和应用方法

指纹识别怎么用

通信辐射源指纹识别技术

Web指纹识别器系列1：开源项目搜集和反思

Musicbrainz 指纹识别

检测音频中的音频[音频识别] [关闭]