为 Weka 生成 Arff 文件

Posted

技术标签:

【中文标题】为 Weka 生成 Arff 文件【英文标题】:Generate an Arff File for Weka 【发布时间】:2015-04-30 10:08:06 【问题描述】:

嘿,我是这项工作的新手,在搜索了如何通过它之后我感到很困惑! 实际上我想为 weka 创建一个稀疏的 ARFF 文件用于文本分类!我一直在网上搜索如何开始使用它。我的要求是生成一个应该与 weka 兼容的稀疏 arff 文件! arff 的大纲应该是这样的:

 @relation myrelation
 @attribute att0 numeric
 @attribute att1 numeric
 @data
 0,1,4,5 , A
 0,5,2,,1 B

这样我有一些字符串,然后是一个类 假设我的数据集如下:

 string is a string A
 Hello a string B
 Another is string C
 .
 .
 .

首先是字符串,然后是 A、B 或 C 类... 所以我想要的是将我的数据集转换为上面提到的稀疏 arff 格式。 有人可以给我一个方向,我该怎么做?请 我想用java来做

【问题讨论】:

【参考方案1】:

您可以使用 Weka 的 StringToWordVector 过滤器将文本转换为词向量(但不一定是稀疏矩阵)。看看我的tutorial。

【讨论】:

先生,您能否提供除此 youtube 链接以外的其他链接,谢谢 你可以通过简单地看一些教程来学习。试试吧。我也不是英国人。 Rushdi Shams 爵士感谢您的教程,您帮助了我很多并解决了我的问题,非常感谢上帝保佑您,Ameen 很高兴知道这一点。谢谢你。阿明。

以上是关于为 Weka 生成 Arff 文件的主要内容,如果未能解决你的问题,请参考以下文章

将网页转换为 ARFF 文件以进行 Weka 分类

使用 Weka Java 代码 - 如何将 CSV(无标题行)转换为 ARFF 格式?

在 weka 中自动对 arff 文件运行多个分类器

Weka java:制作arff文件

如何从 libSVM 中使用的数据集转换为 weka 中使用的格式数据(*.arff 或 *.csv)

ARFF (Weka) 中的缺失值