机器学习笔记非线性变换

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习笔记非线性变换相关的知识,希望对你有一定的参考价值。

一、非线性问题

对于线性不可分的数据资料,用线性模型分类,Ein会很大,相应的Ein=Eout的情况下,Eout也会很大,导致模型表现不好,此时应用非线性模型进行分类,例如:

技术分享技术分享

分类器模型是一个圆形,假设模型可表示为技术分享

转化表示形式技术分享

将平方项和常数项转为一次的Z项,则将非线性的特征空间转化为线性的特征空间技术分享

可以用线性模型进行分类

二、非线性转换

技术分享

技术分享

对于把Q次方的多项式进行全部的一次转换,转换的项数一共为技术分享,转换过后的一次模型的dvc等于总的项数,

总的项数为技术分享,其中d为特征向量的长度

选择合适的转换项数,项数越多代表模型越复杂,但不要为了减少dvc,人为的在脑袋里加工转换特征,例如技术分享

在上述各种转化中,有dvc为2的甚至为1的,但都是进过自己脑海中转化过的特征,不可取

对于不同的Q次方的情况,有如下结果:

技术分享

技术分享,高次对低次具有包含的关系

技术分享

Ein随着Q的次方增大会减少技术分享,但过高的Q次方会带来Eout的增大,不具有泛化能力,做模型建立是首先考虑线性的模型,如果它做的好的话那就很好(Ein和Eout都很小),若不好(Ein始终很大),在选择高次方的模型技术分享

 

以上是关于机器学习笔记非线性变换的主要内容,如果未能解决你的问题,请参考以下文章

机器学习算法笔记6. 降维与主分量分析(PCA)

数据挖掘与机器学习课程学习笔记——2

机器学习|数学基础Mathematics for Machine Learning系列之矩阵理论(11):线性变换的矩阵表示

《机器学习》学习笔记:线性回归逻辑回归

机器学习笔记

机器学习笔记