具有多属性功能的 Weka 属性评估器

Posted

技术标签:

【中文标题】具有多属性功能的 Weka 属性评估器【英文标题】:Weka Attribute Evaluator with multiple-attributes features 【发布时间】:2014-02-26 19:40:27 【问题描述】:

我正在使用单值特征(例如用户的关注者数量)和多值特征(例如一些长直方图,来自 LDA 或例如词袋)。

我只是连接特征,将每个多值特征的每个组件建模为 Weka 属性。我正在使用 SVM 和朴素贝叶斯。

问题是这样的:我想用 Weka 类评估属性,我想将多值特征作为单个属性进行排名(毫无意义,BoF_1342 比 LDA_4103 和 BoF_242 更好,我只想知道BoF 比 LDA 更好)。

Weka 是否支持这种评估?

【问题讨论】:

【参考方案1】:

我不确定 WEKA 是否支持这种聚合。 在这种情况下,解决方案是让您创建一个为您执行此操作的脚本(不确定您是否可以在您的场景中执行此操作) 前任: 你有 4 个属性和三个实例 (BoF_1342,LDA_4103,BoF_242)

BoF_1342 0 - 0 - 0 - 1

LDA_4103 1 - 1 - 0 - 1

BoF_242 0 - 1 - 1 - 0

会变成

BoF 0 - 1 - 1 - 1

LDA 1 - 1 - 0 - 1

【讨论】:

以上是关于具有多属性功能的 Weka 属性评估器的主要内容,如果未能解决你的问题,请参考以下文章

Java 朴素贝叶斯分类器评估

WEKA 如何评估集群?

Weka算法算法翻译(部分)

无需评估即可创建 Weka 分类器模型

使用测试集中的缺失值评估 weka 分类器 J48,R RWeka

如何使用带有 Java 代码的 WEKA 评估类来显示标准差值