使用哪个麦克风进行声音识别是不是重要?
Posted
技术标签:
【中文标题】使用哪个麦克风进行声音识别是不是重要?【英文标题】:Does it matter which microphone is used for sound recognition?使用哪个麦克风进行声音识别是否重要? 【发布时间】:2015-12-29 07:56:23 【问题描述】:如果是,那么音频识别应用如何在不同的设备上工作?
例如,谷歌翻译适用于iphone-6、samsung-s6、htc-m9 ...
【问题讨论】:
【参考方案1】:使用哪种麦克风确实很重要,现代语音识别系统对麦克风非常具体,有时麦克风确实很糟糕,尤其是便宜的桌面麦克风。您使用什么声卡也很重要,许多便宜的卡录制时会产生很多噪音,尤其是在台式机上,这会充分降低识别率。
远说话的麦克风会记录房间回声,这对识别非常有害。靠近嘴巴的领夹麦克风更好。
最近语音识别准确性的改进减少了这个问题,但它仍然很重要。
因此,Nuance 特别推荐使用外部 USB 麦克风而不是嵌入式麦克风。
大多数高端智能手机都有相当不错的麦克风,因此您无需担心它们。这是因为它们在直流电上没有电噪声。它们还设计用于高质量的语音录音。
对于廉价手机和廉价桌面麦克风而言,音频质量仍然是个问题。
【讨论】:
据我所知,现代声音识别系统,例如深度学习,通常需要大量数据来训练模型。开发者在台式机上开发如何获得呢?自己录制似乎效率低下。 这就是为什么谷歌将深度学习推广为一项神奇的技术,它基本上将所有研究锁定在能够负担得起大量计算能力和数据收集资源的大型公司。人们可以使用两个主要方向:开发分布式对等优化以收集世界各地的资源(BOINC 风格)或开发更有效的训练算法。 嗨!我正在尝试用不同麦克风录制的声音来训练模型。首先,我从一个网站下载了一个数据集,其中包含多种声音。其次,我用自己的麦克风在桌面上录制了一些声音。这两个数据集的采样率相同,都是单声道的。 我试图训练一个可以识别两种声音的模型,一个是来自“下载数据集”的 A 类,另一个是来自“记录数据集”的 Z 类。然后,我使用“下载数据集”中的B类进行测试,结果通常是A类。使用“记录数据集”中的class-Y进行测试,结果通常是class-Z。 即:A、B、Y、Z是不同的音。 A、B 来自下载数据集。 Y、Z是我自己记录的。训练模型识别A和Z,结果是B归类为A,Y归类为Z,有意义吗?以上是关于使用哪个麦克风进行声音识别是不是重要?的主要内容,如果未能解决你的问题,请参考以下文章
尝试在使用 SpeechKit 进行语音识别之前播放系统声音