朴素贝叶斯分类器

Posted

技术标签:

【中文标题】朴素贝叶斯分类器【英文标题】:Naive Bayes Classifier 【发布时间】:2017-01-10 17:37:42 【问题描述】:

所以我正在构建一个自动语音识别系统,我想使用 贝叶斯定理 作为分类器。 我仍在阅读它并试图理解它的概念,所以尽量以最简单的方式回答我。

我使用MFCC从我的演讲中提取特征并创建了我的Class_template,这是一个包含行作为单词特征的数组,列代表每个单词(我只使用了十个单词词汇,所以十列是十个单词)。 现在我有了我的一系列特征,我输入了一个新的测试词;对其进行处理并将其转换为特征向量,一切都很好。

我想使用贝叶斯定理来确定我的class_template 中我的新测试词属于哪个类(词)。

所以我开始计算每个单词(我的测试单词和类)的平均值和标准差,现在我认为我应该将这些值插入 PDF(概率密度函数),并使用它来计算我的测试词对我的class_template 中每个词的概率,最高概率。我猜是正确的答案。

1-那么我做错了什么,我正朝着正确的方向前进???

2-任何提示、指示或做什么???

3-当我计算 PDF 时,我应该插入哪个意思和标准,是类的还是我的测试词?

谢谢。

【问题讨论】:

【参考方案1】:

到目前为止,您所描述的大部分是正确的,但是模式类的先验概率如何?如果你假设它是一个均匀分布,那么它与 MLE 相同,并且在小样本上会表现不佳。

【讨论】:

对不起,我没听懂你在说什么?什么是 MLE?? 最大似然估计 我认为你正在做孤立的单词识别,你应该插入该类的 mean 和 var,由相同单词的一些样本组成。 是的,这正是我正在为孤立词做 ASR,我只是不知道下一步是什么??? 你应该假设单词(模式类)的先验概率,就像 P(word1)=0.02, P(word2)=0.02,那么你可以计算 P(word-n|test word) =P(word-n)*P(test word|word-n),通过比较P(word-n|test word),可以判断出test word是哪个词。先验概率是你应该做的假设。

以上是关于朴素贝叶斯分类器的主要内容,如果未能解决你的问题,请参考以下文章

动态朴素贝叶斯分类器和朴素贝叶斯分类器有啥区别

19贝叶斯分类器:半朴素贝叶斯分类器(属性之间存在依赖)

“移花接木”(朴素贝叶斯分类器)

朴素贝叶斯分类器原理

机器学习:贝叶斯分类器——高斯朴素贝叶斯分类器代码实现

机器学习九大算法---朴素贝叶斯分类器