准确率和预测分类器

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了准确率和预测分类器相关的知识,希望对你有一定的参考价值。

我已经在我的数据集(文本分类的类型)上训练了LSTM和决策树。我使用了K-cross fold验证,k=10。

决策树准确率61%LSTM准确率90%。

现在,当我对完全看不见的数据进行预测时,决策树的预测效果比LSTM要好得多。

为什么会这样呢?如果LSTM的准确率更高,那么为什么决策树在未见过的数据上比LSTM表现得更好呢?

答案

训练时,你的LSTM模型可能比决策树有更高的准确率,但事实上,它不能很好地泛化到未见数据,这表明LSTM对训练数据过度拟合。试着调整训练-验证分割和批次大小,看看是否能改善你的模型。

训练过程中的验证损失将表明哪个模型更好。你也可以尝试使用随机森林(决策树群),已知它比单独使用一棵决策树的结果更好。

以上是关于准确率和预测分类器的主要内容,如果未能解决你的问题,请参考以下文章

Pytorch应用:构建分类器

如何对医学大数据进行分类

SKlearn 分类器的诅咒

集成方法

集成方法

机器学习评价指标 本文针对二元分类器