随着时间的推移更新 NaiveBayes 分类器(在 scikit-learn 中)

Posted

技术标签:

【中文标题】随着时间的推移更新 NaiveBayes 分类器(在 scikit-learn 中)【英文标题】:Updating a NaiveBayes Classifier (in scikit-learn) over time 【发布时间】:2014-07-14 19:33:47 【问题描述】:

我正在使用 scikit-learn 构建一个 NaiveBayes 分类器,到目前为止,如果我有一组数据要训练,一切进展顺利。但是,对于我正在从事的特定项目,每天都会有新数据出现,理想情况下这些数据将成为训练集的一部分。

我知道您可以腌制分类器以存储它以供以后使用,但是有没有办法用新数据“更新”分类器?

显然,每天从头开始重新训练分类器是一种选择,但这需要每次都提取大量历史数据,而且时间越来越长。

【问题讨论】:

【参考方案1】:

在朴素贝叶斯估计器上使用partial_fit 方法。

【讨论】:

以上是关于随着时间的推移更新 NaiveBayes 分类器(在 scikit-learn 中)的主要内容,如果未能解决你的问题,请参考以下文章

Textblob 逻辑帮助。 NaiveBayes分类器

在 python 中处理不同数据类型的 NaiveBayes 分类器

使用预训练模型对一个实例进行分类时,NaiveBayes 分类器出错

通过构建混淆矩阵评估 NaiveBayes 分类器

Weka 中 SMO、NaiveBayes 和 BayesNet 分类器的不同结果

使用 NaiveBayes 分类器对 Weka 中的一个实例进行分类