PRML - Chapter 1: Introduction

Posted 2021-08-02 Real&Love

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了PRML - Chapter 1: Introduction相关的知识，希望对你有一定的参考价值。

对于第一章来说，都是一些简单的介绍，是一些机器学习的基础知识，如：训练集、测试集、泛化、有监督学习、无监督学习、特征抽取等基本概念。

基本知识点

训练集 ( training set ) : 用来通过训练来调节模型的参数。
- 输入变量 $\\text{x}$ 的 $N$ 次观测组成，记作 $\\text{X}\\equiv\\{\\text{x}_1,\\cdots,\\text{x}_N\\}$
- 目标变量 $t$ 的 $N$ 次观测组成，记作 $\\mathbf{t}\\equiv\\{t_1,\\cdots,t_N\\}$
学习的结果 : 表示为一个函数 $y (x)$ ，它以新的 $x$ 为输入，产生的 $y$ 为输出，结果与 $t$ 的形式相同。
- $y$ 的具体形式 ( 参数 ) 是在训练 ( training ) 阶段被确定的，也被称为学习 ( learning ) 阶段。
- 当训练阶段完成后，可以使用新的数据集去检验训练的结果，这种数据集称为测试集 ( test set )。
- 泛化 ( generalization ) : 正确分类与训练集不同的新样本的能力。
原始输入向量需要被预处理 ( pre-processed )，变换到新的变量空间，也称为特征抽取 ( feature extraction )，使问题变得更加容易解决。
有监督学习 ( supervised learning )
- 离散输出学习称为分类 ( classification ) 问题
- 连续输出学习称为回归 ( regression ) 问题
无监督学习 ( unsupervised learning )
- 离散输出学习称为聚类 ( clustering ) 问题
- 连续输出学习称为密度估计 ( density estimation )
  - 高维空间投影到二维或者三维空间，为了数据可视化 ( visualization ) 或者降维
反馈学习 ( 强化学习 ) ( reinforcement learning ) : 本书不关注

训练集 ( training set ) : 用来通过训练来调节模型的参数。
- 输入变量 $\\text{x}$ 的 $N$ 次观测组成，记作 $\\text{X}\\equiv\\{\\text{x}_1,\\cdots,\\text{x}_N\\}$
- 目标变量 $t$ 的 $N$ 次观测组成，记作 $\\mathbf{t}\\equiv\\{t_1,\\cdots,t_N\\}$
学习的结果 : 表示为一个函数 $y (x)$ ，它以新的 $x$ 为输入，产生的 $y$ 为输出，结果与 $t$ 的形式相同。
- $y$ 的具体形式 ( 参数 ) 是在训练 ( training ) 阶段被确定的，也被称为学习 ( learning ) 阶段。
- 当训练阶段完成后，可以使用新的数据集去检验训练的结果，这种数据集称为测试集 ( test set )。
- 泛化 ( generalization ) : 正确分类与训练集不同的新样本的能力。
原始输入向量需要被预处理 ( pre-processed )，变换到新的变量空间，也称为特征抽取 ( feature extraction )，使问题变得更加容易解决。
有监督学习 ( supervised learning )
- 离散输出学习称为分类 ( classification ) 问题
- 连续输出学习称为回归 ( regression ) 问题
无监督学习 ( unsupervised learning )
- 离散输出学习称为聚类 ( clustering ) 问题
- 连续输出学习称为密度估计 ( density estimation )
  - 高维空间投影到二维或者三维空间，为了数据可视化 ( visualization ) 或者降维
反馈学习 ( 强化学习 ) ( reinforcement learning ) : 本书不关注

理论基础

前提条件

多项式函数是线性模型，应用于线性回归 ( Ch 03 ) 和线性分类 ( Ch 04 )

$x,\\text{w} ) = w_0 + w_1 x + w_2 x^2 + \\cdots + w_M x^M = \\sum_{j=0}^M w_j x^j$

最小化误差函数 ( error function ) 可以调整多项式函数的参数

$\\text{w} ) =\\frac12\\sum_{n=1}^N [y ( x_n,\\text{w} ) - t_n]^2$

$E_{RMS}=\\sqrt{2E ( \\text{w}^* ) /N}$

多项式的阶数 $M$ 的选择，属于模型对比 ( model comparison ) 问题或者模型选择 ( model selection ) 问题。

拟合问题 : 模型容量与实际问题不匹配

正则化 ( regularization ) : 解决过拟合问题，即给误差函数增加惩罚项

确定模型容量 : 验证集 ( validation set )，也被称为拿出集 ( hold-out set )，缺点是不能充分利用数据

数据集规模 : 训练数据的数量应该是模型可调节参数的数量的 5~10 倍。

最大似然 ( maximum likelihood, ML )

( 建议跟着公式和例子推导 )

理解离散随机变量与连续随机变量之间的关系

离散随机变量

$X=x_i,Y=y_j ) =\\frac{n_{ij}}{N}$

$X=x_i ) = \\frac{c_i}N$

以上是关于PRML - Chapter 1: Introduction的主要内容，如果未能解决你的问题，请参考以下文章