Sklearn:为连续特征、多个标签选择朴素贝叶斯模型

Posted

技术标签:

【中文标题】Sklearn:为连续特征、多个标签选择朴素贝叶斯模型【英文标题】:Sklearn: Choose naive bayes model for continous feature, multiple labels 【发布时间】:2021-07-19 23:53:52 【问题描述】:

假设我有一个数据集,其特征值是连续的,并且有两个以上的可能标签(例如:雨、晴、风等),我应该在 sklearn 中实现哪种朴素贝叶斯模型?

我正在考虑高斯或多项式。但是多项式适用于离散特征,我尝试了高斯,但结果发现预测的准确性就像随机选择一样。

感谢您的帮助, 一哥

【问题讨论】:

您能否编辑问题以包含数据样本?从问题中不清楚输入/输出功能是什么样的。 【参考方案1】:

朴素贝叶斯分类 (NBC) 适用于离散值。 这意味着您必须离散化所有连续的特征。更多详情,this could help

无论如何,多项式是正确的,因为您有多个标签。但您也应该记住,您必须对标签进行一次性编码 (OneHotEncoder in sklearn)。

【讨论】:

以上是关于Sklearn:为连续特征、多个标签选择朴素贝叶斯模型的主要内容,如果未能解决你的问题,请参考以下文章

sklearn:朴素贝叶斯分类器的准确性低

朴素贝叶斯(Naive Bayes)及python实现(sklearn)

SKLearn 朴素贝叶斯:在 tfidf 向量化后添加特征

当 Sklearn 朴素贝叶斯与浮点数一起使用时出现未知标签类型错误

python sklearn 朴素贝叶斯分类

sklearn机器学习之朴素贝叶斯