开源音频模式识别(指纹)[关闭]

Posted

技术标签:

【中文标题】开源音频模式识别(指纹)[关闭]【英文标题】:Open source audio pattern recognition (finger printing) [closed] 【发布时间】:2011-09-10 06:46:00 【问题描述】:

是否有任何开源音频指纹识别解决方案提供“类似 Shazam”的解决方案?

Shazam 使用来自Landmark digital 的商业解决方案,但我正在寻找替代的(即使准确性和性能较差)开源解决方案。

任何人都知道这样的实现,甚至是公布的未实现的算法吗?

【问题讨论】:

【参考方案1】: echoprint 看起来是商业库的可靠替代品。

用于语音识别:

CMUSphinx OpenEars

我们只测试了 echoprint,到目前为止还不错。

我知道答案有点晚了,但随着这个页面在谷歌中弹出,我们不妨随着时间的推移改进它:)

编辑为 CMU 是面向语音的

【讨论】:

语音识别:en.wikipedia.org/wiki/List_of_speech_recognition_software echoprint url 损坏 网址已更新。谢谢@SarveshMishra【参考方案2】:

如果您正在 .NET 中寻找解决方案,请查看 SoundFingerprinting 库。

它是开源的,并建立在 Content Fingerprinting Using Wavelets 研究论文之上。

该算法与 Shazaam 的算法不同,但总体思路相似:从频谱中提取最显着的系数,然后使用它们构建指纹以供以后检索。

算法说明见here。

【讨论】:

你知道我们怎样才能使用SQL server作为永久存储吗?【参考方案3】:

如果您正在寻找 JAVA 库,请选择 MusicG,我在我过去的一个项目中使用过它,并且工作正常。 http://code.google.com/p/musicg/

【讨论】:

【参考方案4】:

那里有一些开源音频识别项目,尽管您可以忘记商业音频识别服务(如 Shazam、SoundHound 等)的质量/性能。这还取决于您想要进行哪种识别(音频文件指纹/标记、实时识别、OTA(Over-The-Air)识别等)

打开界面

AcoustID/MusicBrainz 提供执行音频指纹识别和元数据关联(指纹和服务器)的工具。您可以建立自己的指纹/元数据服务器或使用 MusicBrainz 的服务。音频文件指纹和识别的良好解决方案,不适用于实时高性能应用程序(即OTA)。我们也对它进行了音频流监控(广播监控)的测试,但结果很差。

Echoprint 提供与 AcoustID 相同的工具(指纹和服务器+元数据),也可用于音频流监控,因为它可以准确识别从音频中任何位置获取的 sn-ps(但我不会将它用于严肃的商业应用)。他们还声称它适合 OTA 应用,但性能不适合生产用途。

Last.fm 不是完全开源的,尽管他们已经开源了指纹模块。您必须查询他们的标识和元数据提供者服务,因为他们不提供完整的解决方案。

【讨论】:

【参考方案5】:

好的。不同的搜索关键字,我寻找的所有结果。

http://musicbrainz.org/doc/Audio_Fingerprint

感谢大家观看

【讨论】:

以上是关于开源音频模式识别(指纹)[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

指纹模式识别算法源码及其测试和应用方法

指纹识别怎么用

通信辐射源指纹识别技术

Web指纹识别器系列1:开源项目搜集和反思

Musicbrainz 指纹识别

检测音频中的音频[音频识别] [关闭]