使用 Weka 将一组特征作为一个来衡量

Posted

技术标签:

【中文标题】使用 Weka 将一组特征作为一个来衡量【英文标题】:weigh group of features as one with Weka 【发布时间】:2014-02-09 10:02:32 【问题描述】:

我使用 Weka 构建一个 SVM 分类器,对一些推文进行分类。

某些特征可以用单个值表示(例如,单个推文的转发次数)

其他一些特征是具有非常高维度的向量(例如,包含 1000 个值的词袋直方图)。

如果我在 Weka 中将每个值建模为一个属性;我担心直方图(我认为它是一个单一的特征,但实际上有 1000 个属性)会超过其他单值特征。

在 Weka 中是否有某种方式可以将多值特征作为一个单独的特征来处理?

【问题讨论】:

【参考方案1】:

也许您可以使用第一个选项卡组合功能数组以获得仅一个功能。

在我看来,如果特征数组描述了一个可以拟合到分布的直方图(精度很高,请小心!),您可以将特征数组表示为分布的参数。类似的分布将具有类似的初始化参数,所以这是有道理的。但是您必须检查这是否可以应用于您的数据。

【讨论】:

以上是关于使用 Weka 将一组特征作为一个来衡量的主要内容,如果未能解决你的问题,请参考以下文章

排序算法:概述

使用weka对传感器数据进行分类

衡量模型的准确性和 SVM 中特征的重要性

weka 中看不见的标称值

特征相似性度量

质量如何衡量测试用例质量