朴素贝叶斯分类器

Posted 2023-03-13

技术标签:

【中文标题】朴素贝叶斯分类器【英文标题】：Naive Bayes Classifier 【发布时间】：2017-01-10 17:37:42 【问题描述】：

所以我正在构建一个自动语音识别系统，我想使用 贝叶斯定理 作为分类器。我仍在阅读它并试图理解它的概念，所以尽量以最简单的方式回答我。

我使用MFCC从我的演讲中提取特征并创建了我的Class_template，这是一个包含行作为单词特征的数组，列代表每个单词（我只使用了十个单词词汇，所以十列是十个单词）。现在我有了我的一系列特征，我输入了一个新的测试词；对其进行处理并将其转换为特征向量，一切都很好。

我想使用贝叶斯定理来确定我的class_template 中我的新测试词属于哪个类（词）。

所以我开始计算每个单词（我的测试单词和类）的平均值和标准差，现在我认为我应该将这些值插入 PDF（概率密度函数），并使用它来计算我的测试词对我的class_template 中每个词的概率，最高概率。我猜是正确的答案。

1-那么我做错了什么，我正朝着正确的方向前进？？？

2-任何提示、指示或做什么？？？

3-当我计算 PDF 时，我应该插入哪个意思和标准，是类的还是我的测试词？

谢谢。

【问题讨论】：

【参考方案1】：

到目前为止，您所描述的大部分是正确的，但是模式类的先验概率如何？如果你假设它是一个均匀分布，那么它与 MLE 相同，并且在小样本上会表现不佳。

【讨论】：

对不起，我没听懂你在说什么？什么是 MLE？？最大似然估计我认为你正在做孤立的单词识别，你应该插入该类的 mean 和 var，由相同单词的一些样本组成。是的，这正是我正在为孤立词做 ASR，我只是不知道下一步是什么？？？你应该假设单词（模式类）的先验概率，就像 P(word1)=0.02, P(word2)=0.02，那么你可以计算 P(word-n|test word) =P(word-n)*P(test word|word-n)，通过比较P(word-n|test word)，可以判断出test word是哪个词。先验概率是你应该做的假设。

以上是关于朴素贝叶斯分类器的主要内容，如果未能解决你的问题，请参考以下文章