初识机器学习

Posted yunxintryyoubest

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了初识机器学习相关的知识,希望对你有一定的参考价值。

机器学习定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域

目前有各种不同的学习算法:最主要的两类是监督学习和无监督学习

监督学习:我们会教计算机做某件事情,然后在无监督学习中,我们让计算机自己学习

 

回归问题:我们想要预测连续的数值输出,我们设法预测连续值的属性

例如你有很多的货物,你要把卖的货物看成是一个连续的值,然后进行预测它的价格趋势,可以是一条直线,也可以是二次函数,拟合这个价格趋势

分类问题:目的是预测离散值输出(也是最常见的一种监督学习的方式)

例子:分类的话预测的值可能有很多种,比如0,1等进行分类,可能还有很多种情况,少量的离散值就可以作为分类问题

技术图片

         分类问题

 

 

聚类算法:谷歌新闻所做的是去搜集成千上万条新闻,然后自动将他们分簇,有关同一个主题的新闻被显示在一起,这个就是聚类算法,用在组织大型的计算机集群

就是把不同的个体归入不同的类,这个就是无监督学习,我们没有提前告知这个算法,这个是归于那一类,这个是归于哪一类,相反的我们只是告诉算法,这里有一堆的数据,这个也是聚类算法,聚类算法也是无监督学习的一种。

无监督学习:我不知道这些数据是什么,我也不知道是什么类型,我甚至不知道有哪些类型,需要去自动找到这些数据的结构。虽然说事先我不知道有哪些类型,但是可以自动按得到的类型在把这些个体分成簇,事先是没有将数据集的答案给算法,这个就是无监督学习。

市场分割:找到不同的市场人群,分到不同的细分市场,从而能够自动高效地在不同的细分市场中进行销售,这也就是无监督学习。我们有全部的市场数据,但是预先是不知道有哪些细分市场,而且对于我们数据集中的客户,我们也不能知道谁是细分市场之一,我们必选让算法去自己去数据中发现一切。

技术图片

                     聚类算法(无监督学习的一种)

 

鸡尾酒会算法:分离人声和音乐的声音

[W,s,v]=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x‘);一行代码将不同的音频分开,并且隔离

使用Octave的编程环境,Matlab也可以实现这些算法.最好不要使用C++,java,python等编程环境,使用Octave的编程环境可以更快的入手机器学习。

总的来讲无监督学习就是把数据交给算法让他自动进行处理

以上是关于初识机器学习的主要内容,如果未能解决你的问题,请参考以下文章

吴恩达《机器学习》章节1绪论:初识机器学习

初识机器学习

Andrew Ng机器学习第一章——初识机器学习

初识机器学习

1.0初识机器学习

机器学习——初识及实践选择