机器学习实战-降维

Posted 2021-12-05 gadflywzq

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习实战-降维相关的知识，希望对你有一定的参考价值。

　　降维

　　降维的动力来自于维度魔咒，动辄几万个甚至更多的特征会导致训练变慢，而且，维数越高越难找到合适的解决方案。特征的维数对应着相同维度的一个高维空间，高维空间中点与点的距离很容易变得很大，也就是实例之间的距离很大，训练集的特征空间很稀疏，这容易导致过拟合，当然，通过添加足够多的训练实例，在理论上可以解决这个问题，然而，这个方法需要增加的实例数是成指数增长的，因此不好用。人们于是转而寻求其他的方法：降维。

　　降维之所以可行，基于两点：1.某些特征重要性很低，忽略它也不会对结果造成很大的影响；2.某些特征之间有某些联系，可以通过这些联系来简化特征。

　　降维对于可视化也是有好处的，通过降低维度，然后可视化，可能得到一些有价值的洞见。

　　PCA

　　有很多降维方法可以用，比如投影。PCA也是一种投影方法，它的关键在于找到一个最接近数据的超平面，然后投影其上。

　　　　　　　　　　技术图片