开源音频模式识别(指纹)[关闭]
Posted
技术标签:
【中文标题】开源音频模式识别(指纹)[关闭]【英文标题】:Open source audio pattern recognition (finger printing) [closed] 【发布时间】:2011-09-10 06:46:00 【问题描述】:是否有任何开源音频指纹识别解决方案提供“类似 Shazam”的解决方案?
Shazam 使用来自Landmark digital 的商业解决方案,但我正在寻找替代的(即使准确性和性能较差)开源解决方案。
任何人都知道这样的实现,甚至是公布的未实现的算法吗?
【问题讨论】:
【参考方案1】: echoprint 看起来是商业库的可靠替代品。用于语音识别:
CMUSphinx OpenEars我们只测试了 echoprint,到目前为止还不错。
我知道答案有点晚了,但随着这个页面在谷歌中弹出,我们不妨随着时间的推移改进它:)
编辑为 CMU 是面向语音的
【讨论】:
语音识别:en.wikipedia.org/wiki/List_of_speech_recognition_software echoprint url 损坏 网址已更新。谢谢@SarveshMishra【参考方案2】:如果您正在 .NET 中寻找解决方案,请查看 SoundFingerprinting 库。
它是开源的,并建立在 Content Fingerprinting Using Wavelets 研究论文之上。
该算法与 Shazaam 的算法不同,但总体思路相似:从频谱中提取最显着的系数,然后使用它们构建指纹以供以后检索。
算法说明见here。
【讨论】:
你知道我们怎样才能使用SQL server作为永久存储吗?【参考方案3】:如果您正在寻找 JAVA 库,请选择 MusicG,我在我过去的一个项目中使用过它,并且工作正常。 http://code.google.com/p/musicg/
【讨论】:
【参考方案4】:那里有一些开源音频识别项目,尽管您可以忘记商业音频识别服务(如 Shazam、SoundHound 等)的质量/性能。这还取决于您想要进行哪种识别(音频文件指纹/标记、实时识别、OTA(Over-The-Air)识别等)
打开界面
AcoustID/MusicBrainz 提供执行音频指纹识别和元数据关联(指纹和服务器)的工具。您可以建立自己的指纹/元数据服务器或使用 MusicBrainz 的服务。音频文件指纹和识别的良好解决方案,不适用于实时高性能应用程序(即OTA)。我们也对它进行了音频流监控(广播监控)的测试,但结果很差。
Echoprint 提供与 AcoustID 相同的工具(指纹和服务器+元数据),也可用于音频流监控,因为它可以准确识别从音频中任何位置获取的 sn-ps(但我不会将它用于严肃的商业应用)。他们还声称它适合 OTA 应用,但性能不适合生产用途。
Last.fm 不是完全开源的,尽管他们已经开源了指纹模块。您必须查询他们的标识和元数据提供者服务,因为他们不提供完整的解决方案。
【讨论】:
【参考方案5】:好的。不同的搜索关键字,我寻找的所有结果。
http://musicbrainz.org/doc/Audio_Fingerprint
感谢大家观看
【讨论】:
以上是关于开源音频模式识别(指纹)[关闭]的主要内容,如果未能解决你的问题,请参考以下文章