朴素贝叶斯分类器
Posted
技术标签:
【中文标题】朴素贝叶斯分类器【英文标题】:Naive Bayes Classifier 【发布时间】:2017-01-10 17:37:42 【问题描述】:所以我正在构建一个自动语音识别系统,我想使用 贝叶斯定理 作为分类器。 我仍在阅读它并试图理解它的概念,所以尽量以最简单的方式回答我。
我使用MFCC
从我的演讲中提取特征并创建了我的Class_template
,这是一个包含行作为单词特征的数组,列代表每个单词(我只使用了十个单词词汇,所以十列是十个单词)。
现在我有了我的一系列特征,我输入了一个新的测试词;对其进行处理并将其转换为特征向量,一切都很好。
我想使用贝叶斯定理来确定我的class_template
中我的新测试词属于哪个类(词)。
所以我开始计算每个单词(我的测试单词和类)的平均值和标准差,现在我认为我应该将这些值插入 PDF(概率密度函数),并使用它来计算我的测试词对我的class_template
中每个词的概率,最高概率。我猜是正确的答案。
1-那么我做错了什么,我正朝着正确的方向前进???
2-任何提示、指示或做什么???
3-当我计算 PDF 时,我应该插入哪个意思和标准,是类的还是我的测试词?
谢谢。
【问题讨论】:
【参考方案1】:到目前为止,您所描述的大部分是正确的,但是模式类的先验概率如何?如果你假设它是一个均匀分布,那么它与 MLE 相同,并且在小样本上会表现不佳。
【讨论】:
对不起,我没听懂你在说什么?什么是 MLE?? 最大似然估计 我认为你正在做孤立的单词识别,你应该插入该类的 mean 和 var,由相同单词的一些样本组成。 是的,这正是我正在为孤立词做 ASR,我只是不知道下一步是什么??? 你应该假设单词(模式类)的先验概率,就像 P(word1)=0.02, P(word2)=0.02,那么你可以计算 P(word-n|test word) =P(word-n)*P(test word|word-n),通过比较P(word-n|test word),可以判断出test word是哪个词。先验概率是你应该做的假设。以上是关于朴素贝叶斯分类器的主要内容,如果未能解决你的问题,请参考以下文章