关于感知机的一些问题
Posted
技术标签:
【中文标题】关于感知机的一些问题【英文标题】:Some questions about Perceptron 【发布时间】:2018-02-15 09:07:07 【问题描述】:我正在学习一些 ML,但我的脑海中出现了一些问号,尤其是关于感知器的问题。所以例如我问:
我们可以看到 b 偏差和 w 权重作为我们线性分离器的系数,对吗?这仅在我们处于线性分隔符是一条线的 2D 时才有效?
我们的目标是创建一条线,以便准确地将数据点划分为我们的训练数据,对吗?意味着,在学习阶段结束时,算法“发现”了最能区分两种点的线(如果我们在 2D 中)。这是因为训练数据中有正确的标签 y,算法可以找到真实标签和预测标签之间的距离。
所以进入测试阶段,测试点没有标签,所以在我的想法中感知器只能识别测试点是高于还是低于返回线。这就引出了分类?
也有人使用这个notation for the threshold activate function。
与使用误差差异的另一个相同吗?如果我没记错的话,这用于 -1/+1 类。 顺便说一句,我们将我的观察 I 的 Yi 标签与感知器的输出值联系起来?
【问题讨论】:
【参考方案1】:1) w 和 b 是线性分隔符的系数,与维度无关。 w 和 b 共同表示w^T x + b = 0 所在的点集。 w 与 x 具有相同的维度,并且 b 始终是标量。
这组点将空间分成两个区域。在二维的情况下,点集对应于一条线。在 3 维的情况下,它将对应于一个平面。在更高维度中,您无法真正将其可视化,但它仍然可以正常工作。一般将其称为超平面。
2) 部分正确。测试数据是用来检查你的感知器执行得有多好。除非您知道测试数据的真实类别,否则您无法知道它的性能如何。您通常做的是测量您的感知器正确分类的测试数据的百分比(称为其准确度)。但是,测试数据不会影响感知器。它只是为了测试它。
3) 这是一个不寻常的符号,你应该提供一些上下文,否则我无法告诉你它应该代表什么。
【讨论】:
2) 但是我们正在训练我们的分类器,以便对测试集中的数据点进行分类。我的意思是测试数据是我们模型行为方式的最终证明。那么,如果返回的行对于训练数据是“有效的”,那么如何对测试数据也有效呢?我的意思是,当我们向感知器注入一个新向量作为测试数据时会发生什么?【参考方案2】:由于我无法添加评论,因此我正在使用此答案来澄清关于 deepideas 答案的 rollotommasi 问题。
如果您的训练数据是线性可分的,感知器只会找到最佳解决方案,这意味着最佳解决方案也是最佳解决方案。
那么,如果返回的行对于训练数据是“有效的”,那么如何对测试数据也有效呢?
如您所说,要对新数据进行分类,感知器会返回该数据是否高于或低于该线,也就是说,您的训练集应该以新数据(测试数据)获胜的方式代表整个数据集与训练集相差不大。
想象exclusive-or 2 个特征向量的问题,假设您只考虑每个特征的符号,只要它们相同,输出类为 1,否则输出类为 0。您的数据可以划分为 @987654322 @单层感知器找不到最优解。
现在考虑您的训练集仅包含来自第一和第二象限的数据。对于这个训练集,单层感知器会找到最优解,将象限除以 y 轴。但是,当用剩下的数据测试模型时,它会猜错。
【讨论】:
以上是关于关于感知机的一些问题的主要内容,如果未能解决你的问题,请参考以下文章