[机器学习]第七周记录

Posted greenduck

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[机器学习]第七周记录相关的知识,希望对你有一定的参考价值。

这篇记录的内容来自于Andrew Ng教授在coursera网站上的授课。 


1.不要浪费大量的时间在获得样本上。实际上,太多的样本数并不会使学习算法更加的优秀。要尝试调整你的系数:

  1.使用更少的特征。

  2.增加多项式。

  3.调整$lambda$。

2.诊断学习算法:

  1.将样本打乱,并将其中一部分作为训练样本,剩下的作为测试样本,来判断是否出现了过拟合。

  2.将样本划分为三类:训练集,交叉验证(cross validation,cv)集,测试集。对于线性回归,训练集来得出相应次数下的theta,交叉验证集来比较这些theta,获得最好的模型,测试集继续训练模型。


1.支持向量机(support vector machine,SVM):

 

以上是关于[机器学习]第七周记录的主要内容,如果未能解决你的问题,请参考以下文章

CA周记 - 在 Azure ML 上用 .NET 跑机器学习

Stanford机器学习---第七讲. 机器学习系统设计

第一周记录

Stanford机器学习---第七讲. 机器学习系统设计

Coursera公开课笔记: 斯坦福大学机器学习第七课“正则化”

机器学习中使用的神经网络第七讲