哪个功能,算法适用于说话人验证

Posted

技术标签:

【中文标题】哪个功能,算法适用于说话人验证【英文标题】:Which feature, algorithm is good for Speaker Verification 【发布时间】:2018-01-23 03:32:35 【问题描述】:

我有一个说话者验证的任务。

我的任务是计算两个音频语音之间的相似度,然后与一个阈值进行比较。 例如:两个音频之间的相似度得分为 70%,阈值为 50%。因此,说话者是同一个人。

演讲是文本无关,可以是任何对话。

我有使用 MFCC、GMM 进行说话人识别任务的实验,但是这个任务是不同的,只需比较两个音频特征以获得相似度得分。我不知道哪个特征对说话人验证有好处,哪个算法可以帮助我计算 2 个模式之间的相似度分数。

希望大家多多指教

非常感谢。

【问题讨论】:

【参考方案1】:

目前最先进的是 xvectors:

Deep Neural Network Embeddings for Text-Independent Speaker Verification

在 Kaldi 中的实现是 here。

【讨论】:

【参考方案2】:

我还在研究用于说话人验证的 TIMIT 数据集。我已经提取了 mfcc 特征并为此训练了一个 UBM,并针对每个扬声器进行了调整。在适应方面,我使用了对角矩阵。 你是如何测试wav文件的?但是,当涉及到功能时,您可以使用音高和能量。

【讨论】:

以上是关于哪个功能,算法适用于说话人验证的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Python 中实现 Microsoft 说话人识别/验证 API?

r 适用于R Shiny应用的Google OAuth2身份验证功能

如何让 MD5/digest 身份验证适用于不同的域? [关闭]

国密证书双向认证客户端发送哪个

适用于iOS应用的收据验证码,无法使用

我应该为在 CouchDB 上运行的 Rails 3 使用哪个身份验证 gem/插件?