Weka 3.8 中的属性名称不是唯一的

Posted

技术标签:

【中文标题】Weka 3.8 中的属性名称不是唯一的【英文标题】:Attributes names are not unique in Weka 3.8 【发布时间】:2017-07-28 19:08:33 【问题描述】:

我在导入 CSV 文件时遇到问题。我收到以下错误:文件“filename.csv”未被识别为“CSV 数据文件”文件。原因:属性名称不唯一!原因:'2''1'。

谁能告诉我如何解决这些问题?我在 Windows 10 64 位笔记本电脑上使用 Weka 3.8。

提前致谢。

【问题讨论】:

能否提供您尝试导入的 CSV 样本? 我正在使用 NSL-KDDCup 数据集 正如其他人已经正确回答的那样,特征标签(名称)需要是唯一的。查看下面的链接了解更多信息:cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf 【参考方案1】:

只需确保列名相对于属性值而言是唯一的。当我应用 StringtoWordVector 并获取与我的列名同名的字符串时,就会发生这种情况。只要给一个好的列名:)

【讨论】:

你是我的英雄 =)【参考方案2】:

WEKA 会假设第一行数据是列的名称,但是我查看的 NSL-KDDCup 数据集的版本 github 没有列标题。由于第一行有一些重复的值,您会收到此错误消息。我将提出两种解决方案。

    上述 github 有一个对 weka 友好的 arff 文件,其中包含数据。

    将列标题添加到 csv 文件。列标题应该是什么?它们列在 arff 文件中。 :-)

【讨论】:

【参考方案3】:

当属性名称相同时会发生这种情况,在 Excel 工作表的多列中。只需重命名相同的列名。它应该是独一无二的。这对我有用

【讨论】:

【参考方案4】:

当我将数据集上传到 weka 时,我遇到了同样的错误。当我检查数据集的列时,我发现存在相同的列名。当我更改“fwd 标头长度”值的两个不同列之一的名称时,错误已修复。

【讨论】:

以上是关于Weka 3.8 中的属性名称不是唯一的的主要内容,如果未能解决你的问题,请参考以下文章

名称属性在 HTML 文档中是不是必须是唯一的?

weka 中的属性排名对于所有属性最终都为 0

Weka 3.7.11 中的随机树对数值属性使用啥分割标准?

weka中的训练和测试集不兼容错误?

WEKA 无法识别 .csv 文件中的不同属性

Fiji / Weka 生成的 arff 文件中的原始属性