特征和标签有啥区别? [关闭]

Posted

技术标签:

【中文标题】特征和标签有啥区别? [关闭]【英文标题】:What is the difference between a feature and a label? [closed]特征和标签有什么区别? [关闭] 【发布时间】:2017-04-15 08:18:25 【问题描述】:

我正在关注关于机器学习基础的tutorial,其中提到了一些东西可以是功能标签

据我所知,功能是正在使用的数据的属性。我不知道标签是什么,我知道这个词的意思,但我想知道它在机器学习的上下文中是什么意思。

【问题讨论】:

特征是用作输入的字段,标签用作输出。举个简单的例子,考虑如何根据汽车里程、年份等来预测是否应该出售汽车。是/否是标签,而里程和年份是特征。 我投票结束这个问题是因为Machine learning (ML) theory questions are off-topic on Stack Overflow - gift-wrap candidate for Cross-Validated 【参考方案1】:

让我们举个例子,我们想使用手写照片检测字母表。我们在程序中输入这些样本图像,程序根据它们获得的特征对这些图像进行分类。

此上下文中的一个特征示例是:字母'C' 可以被认为是一个面向右侧的凹面。

现在出现了一个关于如何存储这些特征的问题。我们需要给它们命名。这是标签的作用。 标签被赋予这些特征以区分它们与其他特征。

因此,当提供特征作为输入时,我们获得标签作为输出

标签与无监督学习相关。

【讨论】:

【参考方案2】:

特点:

在机器学习中,特征是指训练数据的属性。或者,您可以说出训练数据集中的列名。

假设这是你的训练数据集

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

那么这里HeightSexAge是特征。

标签:

训练后从模型中获得的输出称为标签。

假设您将上述数据集提供给某个算法并生成一个模型来预测性别为男性或女性,在上述模型中您传递了ageheight 等特征。

所以在计算之后,它将返回性别为男性或女性。这称为标签

【讨论】:

【参考方案3】:

假设您想预测气候,那么提供给您的特征将是历史气候数据、当前天气、温度、风速等,标签将是几个月。 上述组合可以帮助您得出预测。

【讨论】:

【参考方案4】:

先决条件:基本统计和学习机器学习(线性回归)

一句话就能回答——

它们是相似的,但它们的定义会根据需要而变化。

说明

让我解释一下我的说法。假设您有一个数据集,为此考虑exercise.csv。数据集中的每一列都称为特征。 Gender、Age、Height、Heart Rate、Body_temp 和 Calories 可能是各种列之一。每列代表不同的特征或属性。

exercise.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

为了巩固理解和解开谜题,让我们考虑两个不同的问题(预测案例)。

CASE1:在这种情况下,我们可能会考虑使用 - 性别、身高和体重来预测运动期间燃烧的卡路里。该预测(Y)卡路里在这里是一个标签卡路里是您要使用各种特征预测的列 - x1:性别,x2:身高和 x3:体重

CASE2:在第二种情况下,我们可能希望通过使用 Gender 和 Weight 作为特征来预测 Heart_rate。这里 Heart_Rate 是一个 Label,使用 features - x1: Gender 和 x2: Weight 预测。

一旦你理解了上面的解释,你就不会再对标签和特征感到困惑了。

【讨论】:

【参考方案5】:

简单地说,特征是输入;标签是输出。这适用于分类和回归问题。

特征是输入集中的一列数据。例如,如果你试图预测某人会选择的宠物类型,你的输入特征可能包括年龄、家乡、家庭收入等。标签是最终的选择,例如狗、鱼、鬣蜥、岩石、等等

训练完模型后,您将为其提供包含这些特征的新输入集;它将返回该人的预测“标签”(宠物类型)。

【讨论】:

所以[年龄、家乡地区、家庭收入] 将是“3 个特征向量”。在 Keras 中,LSTM 网络的 NumPy 数组将是 [samples, time steps, 3] ? @naisanza:这当然是一种可能性。我对 Keras 不熟悉,但这个高层组织肯定是有效实施的开始。 特征和变量是一回事吗? 我想说“标签”也取决于上下文;例如,为了训练模型,您将使用“标记”数据。在这种情况下,标签是与您的输出数据进行比较的基本事实。 哇。很好的答案,谢谢,这解决了关于这个主题空间的许多挥之不去的问题。【参考方案6】:

这里有一个更直观的方法来解释这个概念。想象一下,您想对照片中显示的动物进行分类。

可能的动物类别是猫或鸟。 在这种情况下,label 将是可能的类关联,例如猫或鸟,您的机器学习算法将预测。

特征是图像中的图案、颜色、形式,例如furr,feathers,或更底层的解释,像素值。

标签:鸟类特征:羽毛

标签:特征:毛皮

【讨论】:

【参考方案7】:

简要说明的功能将是您提供给系统的输入,而标签将是您期望的输出。比如你喂了一条狗的很多特征,比如身高、皮毛颜色等,所以经过计算,它会返回你想知道的狗的品种。

【讨论】:

以上是关于特征和标签有啥区别? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

计算机视觉中的特征和关键点有啥区别?

scikit-learn DecisitonTreeClassifier 中的阈值和特征(对于每个训练的节点)有啥区别?

重载和覆写有啥区别?

attribute和property在英语里有啥区别

1. 计算机的内存按其功能特征可分为几类?各有啥区别?

Oracle的多实例集群有啥特征,能够为企业用户带来啥