[机器学习]第七周记录
Posted greenduck
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[机器学习]第七周记录相关的知识,希望对你有一定的参考价值。
这篇记录的内容来自于Andrew Ng教授在coursera网站上的授课。
1.不要浪费大量的时间在获得样本上。实际上,太多的样本数并不会使学习算法更加的优秀。要尝试调整你的系数:
1.使用更少的特征。
2.增加多项式。
3.调整$lambda$。
2.诊断学习算法:
1.将样本打乱,并将其中一部分作为训练样本,剩下的作为测试样本,来判断是否出现了过拟合。
2.将样本划分为三类:训练集,交叉验证(cross validation,cv)集,测试集。对于线性回归,训练集来得出相应次数下的theta,交叉验证集来比较这些theta,获得最好的模型,测试集继续训练模型。
1.支持向量机(support vector machine,SVM):
以上是关于[机器学习]第七周记录的主要内容,如果未能解决你的问题,请参考以下文章
CA周记 - 在 Azure ML 上用 .NET 跑机器学习