Swift 中的“声音”识别?

Posted

技术标签:

【中文标题】Swift 中的“声音”识别?【英文标题】:"Sound" Recognition in Swift? 【发布时间】:2015-04-22 03:43:35 【问题描述】:

我正在使用 Swift 开发一个应用程序,并且我正在考虑一种在我的项目中获得 非语音 声音识别的方法。

我的意思是有一种方法可以让我接收声音输入并将它们与项目中已经包含的一些预定义声音进行匹配,如果发生匹配,它应该执行一些特定的操作?

有没有办法做到以上几点?我正在考虑分解声音并进行检查,但似乎没有比这更进一步的了。

【问题讨论】:

需要严谨的技术知识。对于缺乏详细的科学计划的人来说,编写其他类型的应用程序可能是个好主意。 【参考方案1】:

我的个人经验遵循上面马特的评论:需要认真的技术知识。

有几种方法可以做到这一点,通常如下:从感兴趣的声音片段中提取一些属性(音频特征提取),并使用某种机器学习技术对该音频特征向量进行分类。这通常需要一些训练阶段,其中机器学习技术会提供一些示例来学习您想要识别的声音(您的预定义声音),以便它可以根据该数据构建模型。

在不知道您想要识别哪种类型的声音的情况下,也许我们在此处提供的 C/C++ SDK 可能会为您解决问题:http://www.samplesumo.com/percussive-sound-recognition 该页面上有一个技术演示,您可以下载并尝试使用您的声音。它是一个 C/C++ 库,并且有 Mac、Windows 和 ios 版本,因此您应该能够将它与 iOS 上的 Swift 应用程序集成。也许这会让你做你需要的?

如果你想开发自己的技术,你可能想从查找和阅读一些使用关键字“声音分类”、“音频识别”、“机器听力”、“音频特征分类”、.. .

【讨论】:

【参考方案2】:

马特,

我们一直在开发一系列很酷的工具来加速 iOS 开发,特别是在 Swift 中。其中一个工具就是我们所说的TLSphinx:一个围绕 Pocketsphinx 的 Swift 包装器,它可以在音频不离开设备的情况下执行语音识别

我认为 TLSphinx 可以帮助您解决问题,因为它是一个完全开源的库。在 Github ('TLSphinx') 上搜索它,您还可以下载我们的 iOS 应用程序 ('Tryolabs Mobile Showcase') 并现场试用该模块以了解它是如何工作的。 希望有用!

最好的!

【讨论】:

以上是关于Swift 中的“声音”识别?的主要内容,如果未能解决你的问题,请参考以下文章

Android中的声音识别

远程通知中的自定义声音 iOS 10,swift 3

C或Python中的声音识别和分类库[关闭]

Swift 2:为数组中的不同图像播放声音

SWIFT 3:将不同的声音文件数组匹配到 CollectionView 中的每个部分

Swift:无法根据数组播放每个声音序列