开啃《机器学习》（周志华）- 第5章神经网络

Posted 2020-10-17

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了开啃《机器学习》（周志华）- 第5章神经网络相关的知识，希望对你有一定的参考价值。

基本概念：

Neural Networks：神经网络，由具有适应性的简单单元组成的广泛并行互联的网络，能够模拟生物神经系统对真实物体之间做出的交互反应
Neuron：神经元，神经网络的组成单元，收到的输入超过阀值时，会被激活，并传递信息到下一级神经元。
M-P神经元模型：每个神经元接收到来自n个其他神经元传来的信号，每个输入信号带有一个connection weight（连接权重），加权得到一个总输入值与threshold（阀值）进行比较，通过activation function（激活函数，如Sigmoid函数）产生神经元的输出

技术分享图片

其中，y为当前神经元输出，f()为激活函数，n、x、w分别为前一级神经元个数、输出值（也是当前神经元的输入值）和权重值。

神经网络的学习过程，就是根据训练数据来调整神经元之间的connection weight和threshold。

perceptron（感知机）：最简单的神经网络，包含一层输入层和一层输出层；其中仅输出层包含功能性神经元（具有激活函数的神经元）
hidden layer（隐含层）：神经网络输入层与输出层之间的功能性神经元
feedforward neural networks（前馈神经网络）：不存在环或回路的神经网络结构

BP（error BackPropagation）算法：

标准BP：算法流程和步骤（待补充）
accumulated BP（累积BP）：

1）标准BP对训练集的单次样本学习会做一次参数调整，而累积BP则对整个训练集学习完后才进行参数调整

2）标准BP由于对不同样例学习后进行更新可能出现抵销的效果，所以需要更多次数的迭代

3）当训练集非常大时，标准BP会有更快更高效的收敛效果

trial-by-error：解决如何设置隐含层神经元的个数问题的常用方法
解决BP算法过拟合的手段：early stopping 和 regularization

Local minimum & Global minimum（全局最小与局部极小）：

全局最小一定是局部极小，反之则不成立
如何解决陷入局部极小的问题：

1）以多组不同参数值初始化神经网络，训练后，取误差最小的接作为最终参数

2）simulated annealing（模拟退火）：每一步迭代以一定概率接受次优解

3）随机梯度下降：计算梯度时加入随机因素，使局部极小时梯度非零，调整梯度下降方向

4）genetic algorithms（遗传算法）

其他神经网络：

RBF（Radial Basis Function）
ART（Adaptive Resonance Threory，competitive learning-竞争型无监督网络）
SOM（Self-Organizing Map，competitive learning-竞争型无监督网络）
Cascade-Correlation Networks（级联相关网络，结构自适应，能学习和调整网络结构本身）
Elman（recurrent neural networks，递归神经网络，能处理与时间有关的动态变化问题）
Boltzmann（energy-based model，基于能量的模型，训练目标为最小化能量值使网络达到最理想状态；神经元都是布尔型）

以上是关于开啃《机器学习》（周志华）- 第5章神经网络的主要内容，如果未能解决你的问题，请参考以下文章

《机器学习》（周志华）第4章决策树笔记理论及实现——“西瓜树”

《机器学习》周志华习题答案5.5

《机器学习》（周志华）第4章决策树笔记理论及实现——“西瓜树”——CART决策树

周志华：关于机器学习的一点思考

《机器学习》周志华版（西瓜书）--课后参考答案

周志华老师的机器学习第五页中，若色泽，根蒂和敲声分别有3,2,2种可能