监督学习、无监督学习、回归
Posted
技术标签:
【中文标题】监督学习、无监督学习、回归【英文标题】:supervised learning,unsupervised learning ,regression 【发布时间】:2014-04-20 13:53:21 【问题描述】:我知道:
-
无监督学习是试图找到隐藏的结构
未标记数据,否则,我们称之为监督学习。
回归也是一种分类,除了它的输出
是无限个数字。
我也知道分类是一种监督学习。
但让我困惑的是:
-
线性回归(线拟合)是一种回归?如果是,为什么它的数据是
未标记?例如,它的样本数据只是一个数量
像 (1,2),(2,3),(1,4) 这样的坐标?
逻辑回归(分类)是一种回归?如果是,为什么它的输出是
只是正常的(value,true of false ,0 or 1)?
谁能帮我解决这个问题?
【问题讨论】:
【参考方案1】:1) 线性回归是监督的,因为您拥有的数据包括输入和输出(可以这么说)。因此,例如,如果您有一个数据集,例如经销商处的汽车销售。您拥有每辆车的品牌、型号、价格、颜色、折扣等信息,但您也拥有每辆车的销售数量。如果这项任务是无监督的,您将拥有一个数据集,其中可能仅包括品牌、型号、价格、颜色等(而不是实际的销售数量),您能做的最好的事情就是对数据进行聚类。该示例并不完美,但旨在了解全局。在决定一个方法是否受到监督时,问自己一个好问题是问“我有办法判断输入的质量吗?”。如果你有线性回归数据,你当然可以。您只需评估输入数据的函数值(在本例中为线)以估计输出。在另一种情况下则不然。
2) 逻辑回归实际上并不是回归。这个名称具有误导性,确实会导致很多混乱。它通常仅用于二进制预测,这使其非常适合分类任务,但仅此而已。
【讨论】:
非常感谢您的黄金法则:“我有判断输入质量的方法吗?,这真的很简单但很有效。现在我明白了。有时机器学习中的名称真是令人困惑。 我不同意您的“逻辑回归实际上不是回归”。 “回归”的定义是“用于估计变量之间关系的统计过程”(来源:***)。回归试图找出因变量与一个或多个自变量之间的关系。在逻辑回归的情况下,我们预测一个概率,它是 [0, 1] 域中的一个变量。我们仍然试图找到该变量与自变量之间的关系。还是回归。 @valentin,您所说的是正确的,但仅在“统计回归”中,但是当我们谈论“监督学习中的回归”时,它与答案不同。参考这个:chemicalstatistician.wordpress.com/2014/01/05/…【参考方案2】:线性回归是有监督的。您从具有已知因变量(标签)的数据集开始,训练您的模型,然后再应用它。您正在尝试预测一个实数,例如房子的价格。
逻辑回归也受到监督。尽管有它的名字,但它更像是一种分类器而不是回归技术。您正在尝试预测班级成员的几率,例如某人死亡的几率。
无监督学习的示例包括聚类和关联分析。
【讨论】:
【参考方案3】: 监督学习 向计算机显示输入(自变量)和指示观察类别(因变量)的相关标签 计算机尝试学习将输入映射到每个类的规则 新数据根据计算机学习的规则进行分类 无监督学习 计算机仅显示输入(自变量) 计算机尝试根据相似性/不相似性对事物进行分类希望一切顺利,干杯
【讨论】:
【参考方案4】:您可以考虑这种解释。
1) 线性回归(线拟合)是一种回归?如果是这样,为什么它的数据没有标记?比如它的样本数据就是一个坐标数量,比如(1,2),(2,3),(1,4)?
x: 1 2 1 是数据
y: 2 3 4 是标签
2)逻辑回归(分类)是一种回归?如果是这样,为什么它的输出只是名义上的(值,真假,0或1)?
值:数据
真/假:标签
【讨论】:
以上是关于监督学习、无监督学习、回归的主要内容,如果未能解决你的问题,请参考以下文章