weka J48 功能选择
Posted
技术标签:
【中文标题】weka J48 功能选择【英文标题】:weka J48 feature selection 【发布时间】:2013-01-15 00:52:34 【问题描述】:我正在使用 Weka 并应用 J48 来构建我的分类器。我有 40 个功能和 2000 个实例(700 个 a 类和 1300 个 b 类)。
J48 决策树只使用了 40 个特征中的 2 个!是否有允许 J48 使用所有功能或者是否有任何其他算法允许使用所有功能?
提前致谢。
【问题讨论】:
【参考方案1】:也许是因为J48不需要更多的属性。
您可以在Select attribute
选项卡中检查特征的相关性,并使用Ranker
作为搜索方法和Principal Components
作为评估器运行选择器。它将向您展示每个特征和每个类之间的关系,它还会告诉您哪些特征最能描述您的类。
【讨论】:
【参考方案2】:分类不需要所有 40 个特征。因为某些特征可能是多余的(例如相关的)或不包含歧视性信息。
您可以在 Weka Explorer 中的 Select attributes
选项卡之前运行功能选择,然后查看哪些功能很重要。
您还可以测试分类器,例如 SVM
(libSVM 或 SMO)、Neural Network
(MultilayerPerceptron)和/或 Random Forest
,因为它们通常会给出最好的分类结果(取决于问题)
【讨论】:
以上是关于weka J48 功能选择的主要内容,如果未能解决你的问题,请参考以下文章