在感知器学习模型的 Python 实现中将数组传递给 numpy.dot()

Posted

技术标签:

【中文标题】在感知器学习模型的 Python 实现中将数组传递给 numpy.dot()【英文标题】:Passing an array to numpy.dot() in Python implementation of Perceptron Learning Model 【发布时间】:2016-07-31 15:56:31 【问题描述】:

我正在尝试将单层感知器分类器的 Python 实现放在一起。我发现 Sebastian Raschka 的“Python 机器学习”一书中的示例非常有用,但我对他的一小部分实现有疑问。这是代码:

import numpy as np    
class Perceptron(object):
    """Perceptron classifier.

    Parameters
    ------------
    eta : float
        Learning rate (between 0.0 and 1.0)
    n_iter : int
        Passes over the training dataset.

    Attributes
    -----------
    w_ : 1d-array
        Weights after fitting.
    errors_ : list
        Number of misclassifications in every epoch.

    """
    def __init__(self, eta=0.01, n_iter=10):
        self.eta = eta
        self.n_iter = n_iter

    def fit(self, X, y):
        """Fit training data.

        Parameters
        ----------
        X : array-like, shape = [n_samples, n_features]
            Training vectors, where n_samples 
            is the number of samples and
            n_features is the number of features.
        y : array-like, shape = [n_samples]
            Target values.

        Returns
        -------
        self : object

        """
        self.w_ = np.zeros(1 + X.shape[1])
        self.errors_ = []

        for _ in range(self.n_iter):
            errors = 0
            for xi, target in zip(X, y):
                update = self.eta * (target - self.predict(xi))
                self.w_[1:] += update * xi
                self.w_[0] += update
                errors += int(update != 0.0)
            self.errors_.append(errors)
        return self

    def net_input(self, X):
        """Calculate net input"""
        return np.dot(X, self.w_[1:]) + self.w_[0]

    def predict(self, X):
        """Return class label after unit step"""
        return np.where(self.net_input(X) >= 0.0, 1, -1)

我无法理解的部分是为什么我们定义net_input()predict() 来获取数组X 而不仅仅是一个向量。一切正常,因为我们只在fit() 函数中将向量xi 传递给predict()(因此也只将向量传递给net_input()),但是定义函数背后的逻辑是什么拿一个数组?如果我正确理解模型,我们一次只取一个样本,计算权重向量和与样本相​​关的特征向量的点积,我们永远不需要将整个数组传递给 net_input() 或 @987654330 @。

【问题讨论】:

不确定我是否完全理解您的问题。似乎当您说数组时,您的意思是一个二维数组,其中每一行都是一个样本向量?如果这不是您的意思,那么您在数组和向量之间有什么区别? 【参考方案1】:

您的担忧似乎是为什么 net_input 和 predict 中的 X 被定义为数组而不是向量(我假设您的定义是我在上面的评论中提到的——虽然我会说在这个上下文)... 是什么让你觉得 X 是一个“数组”而不是一个“向量”?

这里的类型由你传递给函数的内容决定,所以如果你传递一个向量,X 就是一个向量(python 使用所谓的鸭子类型)。所以要回答这个问题,“为什么 net_input 和 predict 被定义为采用数组而不是向量?”......它们不是,它们只是被定义为采用参数 X,这是您传递的任何类型。 .

也许您对他在 fit 上下文中将变量名称 X 作为训练数据的 2d 数组重用但在其他函数中作为单个样本重用感到困惑……它们可能共享一个名称,但彼此不同,在不同的范围内。

【讨论】:

谢谢,菲利普。这回答了我的问题。我对X 的重用感到困惑,在fit() 函数中,它被定义为二维数组(是的,当我说“数组”时,我指的是二维数组)。他们在不同的范围内并且不相关的事实为我澄清了这一点。 很高兴把它清理干净了!如果不仔细命名和注释,python 中的动态类型有时会让人很难分辨出什么是什么……我认为重用 X 并不是一个理想的选择

以上是关于在感知器学习模型的 Python 实现中将数组传递给 numpy.dot()的主要内容,如果未能解决你的问题,请参考以下文章

机器学习之感知器算法原理和Python实现

感知器算法--python实现

感知机(perceptron)及其python代码实现

python机器学习——使用scikit-learn训练感知机模型

机器学习实验一 感知器及其应用

Python_sklearn机器学习库学习笔记the perceptron(感知器)