WEKA 无法识别 .csv 文件中的不同属性

Posted

技术标签:

【中文标题】WEKA 无法识别 .csv 文件中的不同属性【英文标题】:WEKA does not recognise different attributes from a .csv file 【发布时间】:2021-11-22 05:29:17 【问题描述】:

我在 WEKA 中打开数据集时遇到问题。虽然在其 .csv 格式中,所有变量和各自的值都被清楚地区分,但在 WEKA 我只有一个属性,如下所示:

PINCP;艾格普;朗讯; RACWHT; RACBLK;拉卡斯;性别;等等

相关的值看起来很相似,也用分号分隔。

您对如何完成这项工作有任何建议吗?

提前致谢!

【问题讨论】:

【参考方案1】:

CSV 代表comma-separated values。另一方面,您的数据集使用分号作为单元格之间的分隔符。

在 Weka Explorer 中打开您的数据集时,请选中文件选择器对话框中的 调用选项对话框 框。然后将 fieldSeparator 选项从逗号更改为分号。

如果您使用命令行加载数据集,请使用 CSVLoader 类的 -F 选项。

【讨论】:

以上是关于WEKA 无法识别 .csv 文件中的不同属性的主要内容,如果未能解决你的问题,请参考以下文章

Weka 3.8 中的属性名称不是唯一的

Python 无法识别 csv 文件中的新行

Fiji / Weka 生成的 arff 文件中的原始属性

我的 CSV 文件带有双引号括起来的字段 - 无法识别数值“12131”

WEKA中的预测结果是啥意思?

Chrome 文件上传无法识别接受 mimetype 'text/csv'