反向传播神经网络中的最优特征实例比

Posted

技术标签:

【中文标题】反向传播神经网络中的最优特征实例比【英文标题】:Optimal Feature-to-Instance Ratio in Back Propagation Neural Network 【发布时间】:2011-12-26 18:43:39 【问题描述】:

我正在尝试执行留一法交叉验证,以便使用反向传播神经网络对特定问题进行建模。我的训练数据中有 8 个特征和 20 个实例。我试图让 NN 在构建预测模型时学习一个函数。现在,问题是预测中的错误率非常高。我的猜测是,与所考虑的特征数量相比,训练中的实例数量更少。这个结论是否正确。是否有任何最佳特征与实例比率?

【问题讨论】:

【参考方案1】:

(鉴于数据集通常被描述为 mxn 矩阵,其中 m 是行数(数据点),n 是列数(特征);显然 m >> n 是首选。)

在一个事件中,我不知道可接受的特征到观察范围的一般规则;这可能有几个原因:

这样的比率很大程度上取决于数据的质量 (信噪比);和

特征的数量只是模型复杂度的一个元素(例如,特征之间的交互);而模型复杂度是数据实例(数据点)数量的最强决定因素。

所以对于这个问题有两套套方法——因为它们是对立的,所以它们都可以应用于同一个模型:

减少特征数量;或

使用统计技术来利用您拥有的数据

一些建议,针对上述两条路径中的每一条:

    消除“不重要”的特征——即那些对响应变量的可变性没有贡献的特征。主成分分析 (PCA) 是一种快速且可靠的方法,尽管还有许多其他技术通常包含在“降维”标题下。

    使用 引导方法 而不是交叉验证。方法上的差异似乎很小,但多层感知器(神经网络)在减少预测误差方面(通常是实质性的)改进已得到充分证明(参见例如,Efron, B. 和 Tibshirani, RJ,引导方法:改进关于交叉验证, J. of the American Statistical Association, 92, 548-560., 1997)。如果您不熟悉用于拆分训练和测试数据的 Bootstrap 方法,则一般技术类似于交叉验证,只是您采用 subsamples 而不是采用整个数据集的子集。 Elements 的第 7.11 节很好地介绍了 Bootstrap 方法。

我发现关于这个一般主题的最佳单一来源是优秀论文 统计学习的要素 中的第 7 章模型评估和选择 > Hastie、Tibshirani 和弗里德曼着。本书可从本书的homepage 免费下载。

【讨论】:

非常感谢您的见解和宝贵建议。我在一些机器学习模型中读到,如果训练样本中的实例数量较少,则会重复多次。这种构建训练集的方法是否有效?

以上是关于反向传播神经网络中的最优特征实例比的主要内容,如果未能解决你的问题,请参考以下文章

反向传播

神经网络反向传播算法(4,5)

神经网络系列之二 -- 反向传播与梯度下降

神经网络反向传播推导(实例)

机器学习之五:神经网络反向传播算法

007-卷积神经网络-前向传播-反向传播