关于感知机的一些问题

Posted 2023-03-13

技术标签:

【中文标题】关于感知机的一些问题【英文标题】：Some questions about Perceptron 【发布时间】：2018-02-15 09:07:07 【问题描述】：

我正在学习一些 ML，但我的脑海中出现了一些问号，尤其是关于感知器的问题。所以例如我问：

我们可以看到 b 偏差和 w 权重作为我们线性分离器的系数，对吗？这仅在我们处于线性分隔符是一条线的 2D 时才有效？

我们的目标是创建一条线，以便准确地将数据点划分为我们的训练数据，对吗？意味着，在学习阶段结束时，算法“发现”了最能区分两种点的线（如果我们在 2D 中）。这是因为训练数据中有正确的标签 y，算法可以找到真实标签和预测标签之间的距离。

所以进入测试阶段，测试点没有标签，所以在我的想法中感知器只能识别测试点是高于还是低于返回线。这就引出了分类？

也有人使用这个notation for the threshold activate function。

与使用误差差异的另一个相同吗？如果我没记错的话，这用于 -1/+1 类。顺便说一句，我们将我的观察 I 的 Yi 标签与感知器的输出值联系起来？

【问题讨论】：

【参考方案1】：

1) w 和 b 是线性分隔符的系数，与维度无关。 w 和 b 共同表示w^T x + b = 0 所在的点集。 w 与 x 具有相同的维度，并且 b 始终是标量。

这组点将空间分成两个区域。在二维的情况下，点集对应于一条线。在 3 维的情况下，它将对应于一个平面。在更高维度中，您无法真正将其可视化，但它仍然可以正常工作。一般将其称为超平面。

2) 部分正确。测试数据是用来检查你的感知器执行得有多好。除非您知道测试数据的真实类别，否则您无法知道它的性能如何。您通常做的是测量您的感知器正确分类的测试数据的百分比（称为其准确度）。但是，测试数据不会影响感知器。它只是为了测试它。

3) 这是一个不寻常的符号，你应该提供一些上下文，否则我无法告诉你它应该代表什么。

【讨论】：

2) 但是我们正在训练我们的分类器，以便对测试集中的数据点进行分类。我的意思是测试数据是我们模型行为方式的最终证明。那么，如果返回的行对于训练数据是“有效的”，那么如何对测试数据也有效呢？我的意思是，当我们向感知器注入一个新向量作为测试数据时会发生什么？【参考方案2】：

由于我无法添加评论，因此我正在使用此答案来澄清关于 deepideas 答案的 rollotommasi 问题。

如果您的训练数据是线性可分的，感知器只会找到最佳解决方案，这意味着最佳解决方案也是最佳解决方案。

那么，如果返回的行对于训练数据是“有效的”，那么如何对测试数据也有效呢？

如您所说，要对新数据进行分类，感知器会返回该数据是否高于或低于该线，也就是说，您的训练集应该以新数据（测试数据）获胜的方式代表整个数据集与训练集相差不大。

想象exclusive-or 2 个特征向量的问题，假设您只考虑每个特征的符号，只要它们相同，输出类为 1，否则输出类为 0。您的数据可以划分为 @987654322 @单层感知器找不到最优解。

现在考虑您的训练集仅包含来自第一和第二象限的数据。对于这个训练集，单层感知器会找到最优解，将象限除以 y 轴。但是，当用剩下的数据测试模型时，它会猜错。

【讨论】：

以上是关于关于感知机的一些问题的主要内容，如果未能解决你的问题，请参考以下文章