为 Weka 生成 Arff 文件
Posted
技术标签:
【中文标题】为 Weka 生成 Arff 文件【英文标题】:Generate an Arff File for Weka 【发布时间】:2015-04-30 10:08:06 【问题描述】:嘿,我是这项工作的新手,在搜索了如何通过它之后我感到很困惑! 实际上我想为 weka 创建一个稀疏的 ARFF 文件用于文本分类!我一直在网上搜索如何开始使用它。我的要求是生成一个应该与 weka 兼容的稀疏 arff 文件! arff 的大纲应该是这样的:
@relation myrelation
@attribute att0 numeric
@attribute att1 numeric
@data
0,1,4,5 , A
0,5,2,,1 B
这样我有一些字符串,然后是一个类 假设我的数据集如下:
string is a string A
Hello a string B
Another is string C
.
.
.
首先是字符串,然后是 A、B 或 C 类... 所以我想要的是将我的数据集转换为上面提到的稀疏 arff 格式。 有人可以给我一个方向,我该怎么做?请 我想用java来做
【问题讨论】:
【参考方案1】:您可以使用 Weka 的 StringToWordVector 过滤器将文本转换为词向量(但不一定是稀疏矩阵)。看看我的tutorial。
【讨论】:
先生,您能否提供除此 youtube 链接以外的其他链接,谢谢 你可以通过简单地看一些教程来学习。试试吧。我也不是英国人。 Rushdi Shams 爵士感谢您的教程,您帮助了我很多并解决了我的问题,非常感谢上帝保佑您,Ameen 很高兴知道这一点。谢谢你。阿明。以上是关于为 Weka 生成 Arff 文件的主要内容,如果未能解决你的问题,请参考以下文章
使用 Weka Java 代码 - 如何将 CSV(无标题行)转换为 ARFF 格式?