weka 中看不见的标称值

Posted

技术标签:

【中文标题】weka 中看不见的标称值【英文标题】:Unseen nominal values in weka 【发布时间】:2013-12-14 01:15:27 【问题描述】:

我有一个数据集,其中包含一些标称值作为特征。我拥有的训练集有一组标称特征的值,这些值在我的测试集中不存在。 例如我在训练集中的特征对应于

@attribute h4 br,pl,com,ro,th,np

和测试集中相同的特征有

@attribute h4 br,pl,abc,th,def,ghi,lmno

我相信正因为如此,weka 不允许我在测试集上重新评估我在训练集上构建的模型。有没有解决的办法?我错过了什么吗?

编辑:我使用的是 RandomForest 分类器。

谢谢

【问题讨论】:

您应该能够在训练集和测试集中使用相同的属性声明。如果不是所有声明的值都出现在数据中,这不是问题。 【参考方案1】:

Weka 寻求测试集中使用的所有名义值也存在于训练集中,因为分类器应该在做出预测之前学习。

Weka 还使用标称值及其索引;因此,对同一属性的名义值使用相同的顺序以获得可靠的结果非常重要。

在您的情况下,只需对训练集和测试集以相同的顺序使用相同的值(涵盖所有值)。

您的组合值br,pl,com,ro,th,np,abc,th,def,ghi,lmno 可用于训练集和测试集。

【讨论】:

以上是关于weka 中看不见的标称值的主要内容,如果未能解决你的问题,请参考以下文章

weka - 标准化标称值

weka中类属性标称值的排序

c4d视图中看不见节点,画完的样条线看不见节点。点模式也看不见。

Unity 场景中看不到物体或者OnDrawGizmos画的线看不到

升级AndroidStuido 4.2后 Gradle Tasks 不见了?

电脑中EF盘突然不见,磁盘管理出现两个空盘,大小和我的EF盘一样大