weka 中用于推文分类的 N 折交叉验证

Posted

技术标签:

【中文标题】weka 中用于推文分类的 N 折交叉验证【英文标题】:N fold cross validation in weka for tweet classification 【发布时间】:2014-03-21 00:19:36 【问题描述】:

我的目标是使用 weka 将一堆推文分类为一组预定义的 3 个类别(例如新闻、教育、体育)

在这种情况下,训练集和测试集是不同的。(训练冗长的网页,只测试一两行推文)。

如何针对这个问题执行 'N' 折交叉验证。

我是否需要混合训练和测试数据集以构成单个文件并应用“n”折交叉验证,或者我是否需要先训练分类器然后对测试集应用“n”折交叉验证韦卡。

我认为后者是有道理的,但我不确定。请帮我解决这个问题。

【问题讨论】:

【参考方案1】:

您的数据的性质在训练和集合中应该是相同的。这一要求使得 N 折交叉验证技术可用。

关于选型的问题,看看这个: https://vimeo.com/29569892

【讨论】:

以上是关于weka 中用于推文分类的 N 折交叉验证的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Weka API 在 J48 / C4.5 上进行 10 倍交叉验证后保存最佳树

如何进行交叉验证 SVM 分类器

如何在朴素贝叶斯分类器中使用 k 折交叉验证?

机器学习中数据的划分,N折交叉验证

R:训练数据集的 k 折交叉验证

MATLAB 中神经网络分类的 10 折交叉验证示例