weka J48 功能选择

Posted

技术标签:

【中文标题】weka J48 功能选择【英文标题】:weka J48 feature selection 【发布时间】:2013-01-15 00:52:34 【问题描述】:

我正在使用 Weka 并应用 J48 来构建我的分类器。我有 40 个功能和 2000 个实例(700 个 a 类和 1300 个 b 类)。

J48 决策树只使用了 40 个特征中的 2 个!是否有允许 J48 使用所有功能或者是否有任何其他算法允许使用所有功能?

提前致谢。

【问题讨论】:

【参考方案1】:

也许是因为J48不需要更多的属性。

您可以在Select attribute 选项卡中检查特征的相关性,并使用Ranker 作为搜索方法和Principal Components 作为评估器运行选择器。它将向您展示每个特征和每个类之间的关系,它还会告诉您哪些特征最能描述您的类。

【讨论】:

【参考方案2】:

分类不需要所有 40 个特征。因为某些特征可能是多余的(例如相关的)或不包含歧视性信息。

您可以在 Weka Explorer 中的 Select attributes 选项卡之前运行功能选择,然后查看哪些功能很重要。

您还可以测试分类器,例如 SVM(libSVM 或 SMO)、Neural Network(MultilayerPerceptron)和/或 Random Forest,因为它们通常会给出最好的分类结果(取决于问题)

【讨论】:

以上是关于weka J48 功能选择的主要内容,如果未能解决你的问题,请参考以下文章

使用 J48 构建分类器

如何解释 weka 分类结果 J48

Weka:如何在 J48 决策树中实现代理拆分?

ID3 和 J48 使用 Weka

如何在 weka 中可视化 j48 树

Weka J48 分类器:无法处理数字类?