橙色用于数据挖掘和看不见的测试集

Posted

技术标签:

【中文标题】橙色用于数据挖掘和看不见的测试集【英文标题】:Orange for Data Mining and Unseen Test Sets 【发布时间】:2013-02-23 09:18:40 【问题描述】:

我正在使用 Orange 进行数据挖掘 (http://orange.biolab.si/) 1 和 LinearSVM。有没有办法保存学习模型并将其与看不见的测试集一起使用?我需要查看预测结果并将模型应用于新数据。

谢谢

【问题讨论】:

【参考方案1】:

这里是

import Orange, cPickle
from Orange.classification import svm

data = Orange.data.Table("2_new.tab")
classifier = svm.LinearSVMLearner(data, folds=10)
cPickle.dump(classifier, open("linear_svm.pck", "wb"))

# later:

classifier = cPickle.load(open('linear_svm.pck'))
data_validation = Orange.data.Table('show.tab')
print 'predictions:'
for e in data_validation:
    print e, "\t", classifier(e)

【讨论】:

以上是关于橙色用于数据挖掘和看不见的测试集的主要内容,如果未能解决你的问题,请参考以下文章

通过先前训练的模型预测看不见的数据

dbvisualize为啥有些数据库看不见了

weka 中看不见的标称值

如何使用 2 个数据集,1 个用于训练,1 个用于在 WEKA 上进行情感分析测试

用于测试非线性 SVM 的数据集

正确拆分数据集