ML Lecture4: Classification

Posted hsuppr

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ML Lecture4: Classification相关的知识,希望对你有一定的参考价值。

1.为什么不用Regression?

用Regression显然会得到紫色线,而不是绿线

技术图片

 2.定义Loss Function

即分类不正确的样本个数

技术图片

3.求每个元素在某个类别的概率

p(class1|x) = p(x|class1)p(class1) / [p(x|class1)p(class1) + p(x|class2)p(class2)]

p(class1)和p(class2)可以容易的算出

重点在于求p(x|class1)

假设class1是个高斯分布,我们如果有高斯分布的参数miu,sigma,就能求出p(x|class1)

 现在问题是找到最可能生成出样本的高斯分布。

用Maximum Likelihood估计出miu,sigma。

在二位四个参数的时候,miu1,miu2,sigma1,sigma2,实际效果不好。

尝试让miu1=miu2,按样本数加权平均获得sigma,转换成Linear。

 4.总结

Three Steps

first: Functions Set(Model) 如何定义分类

second: Goodness of a function 评估一个Model,

third: Find the best function

5.Naive Bayes Classifer

假设各个特征独立

p(x|c1)=p(x1|c1)*p(x2|c1)*...*p(xk|c1)

这样就没有高维分布,转化为一维分布

 

以上是关于ML Lecture4: Classification的主要内容,如果未能解决你的问题,请参考以下文章

[课堂笔记]斯坦福大学公开课:IOS 7应用开发 lecture4

ArcGIS应用(二十)Arcgis 栅格图像符号系统提示“This dataset does not have valid histogram required for classificati…”

ArcGIS应用(二十)Arcgis 栅格图像符号系统提示“This dataset does not have valid histogram required for classificati…”

cs231n spring 2017 lecture4 听课笔记

《2021机器学习-李宏毅》学习笔记

CS109 Lecture 4