Sklearn:为连续特征、多个标签选择朴素贝叶斯模型
Posted
技术标签:
【中文标题】Sklearn:为连续特征、多个标签选择朴素贝叶斯模型【英文标题】:Sklearn: Choose naive bayes model for continous feature, multiple labels 【发布时间】:2021-07-19 23:53:52 【问题描述】:假设我有一个数据集,其特征值是连续的,并且有两个以上的可能标签(例如:雨、晴、风等),我应该在 sklearn 中实现哪种朴素贝叶斯模型?
我正在考虑高斯或多项式。但是多项式适用于离散特征,我尝试了高斯,但结果发现预测的准确性就像随机选择一样。
感谢您的帮助, 一哥
【问题讨论】:
您能否编辑问题以包含数据样本?从问题中不清楚输入/输出功能是什么样的。 【参考方案1】:朴素贝叶斯分类 (NBC) 适用于离散值。 这意味着您必须离散化所有连续的特征。更多详情,this could help
无论如何,多项式是正确的,因为您有多个标签。但您也应该记住,您必须对标签进行一次性编码 (OneHotEncoder in sklearn)。
【讨论】:
以上是关于Sklearn:为连续特征、多个标签选择朴素贝叶斯模型的主要内容,如果未能解决你的问题,请参考以下文章
朴素贝叶斯(Naive Bayes)及python实现(sklearn)
SKLearn 朴素贝叶斯:在 tfidf 向量化后添加特征