快速矿工:如何向数据集添加“标签”属性?

Posted

技术标签:

【中文标题】快速矿工:如何向数据集添加“标签”属性?【英文标题】:rapid miner: how to add a 'label' attribute to a dataset? 【发布时间】:2013-03-30 13:12:54 【问题描述】:

我想对从 CSV 导入的数据集应用决策树学习算法。 问题是决策树块的“tra”输入仍然是红色的,说明“输入示例集必须具有特殊属性'label'。”。 如何添加该标签?它是什么? 我已经玩了一段时间没有结果。任何帮助表示赞赏。

附录:列的标题已被正确推断,所以我不知道“标签”是什么。

【问题讨论】:

【参考方案1】:

在 RapidMiner 中导入数据时,在第 4 步中,您需要为要分类的列选择属性类型“标签”。

点击底部的下一步按钮。

在第 5 步中,它会要求您保存导入文件,选择任何合适的名称并单击“完成”。

【讨论】:

感谢您的回答。您的建议是正确的,但实际上我发现 Josef Borkovec 的答案更有用,因为它适用于计算的任何阶段,并且不仅限于数据导入。【参考方案2】:

标签是代表分类目标类的属性。 “设置角色”运算符可以将属性设置为标签,但您可以在导入数据时这样做 - 大多数导入运算符都可以配置为设置属性的角色。 “读取 CSV”就是其中之一。

【讨论】:

以上是关于快速矿工:如何向数据集添加“标签”属性?的主要内容,如果未能解决你的问题,请参考以下文章

如何向线性回归数据集添加异常值?

如何向矢量化数据集添加特征?

向数据集添加行

如何在数据集c#中向现有数据表添加行?

为啥 h5py 在向数据集添加 3 个可变长度字符串时会抛出错误?

向 Rapidminer 中的数字属性添加常量值