weka 中看不见的标称值
Posted
技术标签:
【中文标题】weka 中看不见的标称值【英文标题】:Unseen nominal values in weka 【发布时间】:2013-12-14 01:15:27 【问题描述】:我有一个数据集,其中包含一些标称值作为特征。我拥有的训练集有一组标称特征的值,这些值在我的测试集中不存在。 例如我在训练集中的特征对应于
@attribute h4 br,pl,com,ro,th,np
和测试集中相同的特征有
@attribute h4 br,pl,abc,th,def,ghi,lmno
我相信正因为如此,weka 不允许我在测试集上重新评估我在训练集上构建的模型。有没有解决的办法?我错过了什么吗?
编辑:我使用的是 RandomForest 分类器。
谢谢
【问题讨论】:
您应该能够在训练集和测试集中使用相同的属性声明。如果不是所有声明的值都出现在数据中,这不是问题。 【参考方案1】:Weka 寻求测试集中使用的所有名义值也存在于训练集中,因为分类器应该在做出预测之前学习。
Weka 还使用标称值及其索引;因此,对同一属性的名义值使用相同的顺序以获得可靠的结果非常重要。
在您的情况下,只需对训练集和测试集以相同的顺序使用相同的值(涵盖所有值)。
您的组合值br,pl,com,ro,th,np,abc,th,def,ghi,lmno
可用于训练集和测试集。
【讨论】:
以上是关于weka 中看不见的标称值的主要内容,如果未能解决你的问题,请参考以下文章
c4d视图中看不见节点,画完的样条线看不见节点。点模式也看不见。
Unity 场景中看不到物体或者OnDrawGizmos画的线看不到