[机器学习]第七周记录

Posted 2020-11-25 greenduck

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了[机器学习]第七周记录相关的知识，希望对你有一定的参考价值。

这篇记录的内容来自于Andrew Ng教授在coursera网站上的授课。

1.不要浪费大量的时间在获得样本上。实际上，太多的样本数并不会使学习算法更加的优秀。要尝试调整你的系数：

　　1.使用更少的特征。

　　2.增加多项式。

　　3.调整$lambda$。

2.诊断学习算法：

　　1.将样本打乱，并将其中一部分作为训练样本，剩下的作为测试样本，来判断是否出现了过拟合。

　　2.将样本划分为三类：训练集，交叉验证(cross validation,cv)集，测试集。对于线性回归，训练集来得出相应次数下的theta，交叉验证集来比较这些theta，获得最好的模型，测试集继续训练模型。

1.支持向量机(support vector machine,SVM)：

以上是关于[机器学习]第七周记录的主要内容，如果未能解决你的问题，请参考以下文章