机器学习笔记机器学习可行性分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习笔记机器学习可行性分析相关的知识,希望对你有一定的参考价值。

技术分享

从大量数据中抽取出一些样本,例如,从大量弹珠中随机抽取出一些样本,总的样本中橘色弹珠的比例为技术分享,抽取出的样本中橘色弹珠的比例为技术分享,这两个比例的值相差很大的几率很小,数学公式表示为:

技术分享

用抽取到的样本作为训练样本集(in-sample),可以求得一个最佳的假设g,该假设最大可能的接近目标函数f,但是在训练样本集之外的其他样本(out-of-sample)中,假设g和目标函数f可能差别很远,不能说抽取样本分布等同于所有样本的分布,只是大致相近。

二者的错误几率相差为:

技术分享

当数据资料足够多,且模型H集合有有限个的选择,可以得到Ein和Eout是大致相等的

技术分享

 

以上是关于机器学习笔记机器学习可行性分析的主要内容,如果未能解决你的问题,请参考以下文章

机器学习 决策树

机器学习基石机器学习的可行性

机器学习基石线性回归

鹅厂优文 | 决策树及ID3算法学习

Python机器学习算法之决策树算法

浏览器中实现深度学习?有人分析了7个基于JS语言的DL框架,发现还有很长的路要走