Weka 3.8 中的属性名称不是唯一的
Posted
技术标签:
【中文标题】Weka 3.8 中的属性名称不是唯一的【英文标题】:Attributes names are not unique in Weka 3.8 【发布时间】:2017-07-28 19:08:33 【问题描述】:我在导入 CSV 文件时遇到问题。我收到以下错误:文件“filename.csv”未被识别为“CSV 数据文件”文件。原因:属性名称不唯一!原因:'2''1'。
谁能告诉我如何解决这些问题?我在 Windows 10 64 位笔记本电脑上使用 Weka 3.8。
提前致谢。
【问题讨论】:
能否提供您尝试导入的 CSV 样本? 我正在使用 NSL-KDDCup 数据集 正如其他人已经正确回答的那样,特征标签(名称)需要是唯一的。查看下面的链接了解更多信息:cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf 【参考方案1】:只需确保列名相对于属性值而言是唯一的。当我应用 StringtoWordVector 并获取与我的列名同名的字符串时,就会发生这种情况。只要给一个好的列名:)
【讨论】:
你是我的英雄 =)【参考方案2】:WEKA 会假设第一行数据是列的名称,但是我查看的 NSL-KDDCup 数据集的版本 github 没有列标题。由于第一行有一些重复的值,您会收到此错误消息。我将提出两种解决方案。
上述 github 有一个对 weka 友好的 arff 文件,其中包含数据。
将列标题添加到 csv 文件。列标题应该是什么?它们列在 arff 文件中。 :-)
【讨论】:
【参考方案3】:当属性名称相同时会发生这种情况,在 Excel 工作表的多列中。只需重命名相同的列名。它应该是独一无二的。这对我有用
【讨论】:
【参考方案4】:当我将数据集上传到 weka 时,我遇到了同样的错误。当我检查数据集的列时,我发现存在相同的列名。当我更改“fwd 标头长度”值的两个不同列之一的名称时,错误已修复。
【讨论】:
以上是关于Weka 3.8 中的属性名称不是唯一的的主要内容,如果未能解决你的问题,请参考以下文章