初识机器学习
Posted yunxintryyoubest
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了初识机器学习相关的知识,希望对你有一定的参考价值。
机器学习定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域
目前有各种不同的学习算法:最主要的两类是监督学习和无监督学习
监督学习:我们会教计算机做某件事情,然后在无监督学习中,我们让计算机自己学习
回归问题:我们想要预测连续的数值输出,我们设法预测连续值的属性
例如你有很多的货物,你要把卖的货物看成是一个连续的值,然后进行预测它的价格趋势,可以是一条直线,也可以是二次函数,拟合这个价格趋势
分类问题:目的是预测离散值输出(也是最常见的一种监督学习的方式)
例子:分类的话预测的值可能有很多种,比如0,1等进行分类,可能还有很多种情况,少量的离散值就可以作为分类问题
分类问题
聚类算法:谷歌新闻所做的是去搜集成千上万条新闻,然后自动将他们分簇,有关同一个主题的新闻被显示在一起,这个就是聚类算法,用在组织大型的计算机集群
就是把不同的个体归入不同的类,这个就是无监督学习,我们没有提前告知这个算法,这个是归于那一类,这个是归于哪一类,相反的我们只是告诉算法,这里有一堆的数据,这个也是聚类算法,聚类算法也是无监督学习的一种。
无监督学习:我不知道这些数据是什么,我也不知道是什么类型,我甚至不知道有哪些类型,需要去自动找到这些数据的结构。虽然说事先我不知道有哪些类型,但是可以自动按得到的类型在把这些个体分成簇,事先是没有将数据集的答案给算法,这个就是无监督学习。
市场分割:找到不同的市场人群,分到不同的细分市场,从而能够自动高效地在不同的细分市场中进行销售,这也就是无监督学习。我们有全部的市场数据,但是预先是不知道有哪些细分市场,而且对于我们数据集中的客户,我们也不能知道谁是细分市场之一,我们必选让算法去自己去数据中发现一切。
聚类算法(无监督学习的一种)
鸡尾酒会算法:分离人声和音乐的声音
[W,s,v]=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x‘);一行代码将不同的音频分开,并且隔离
使用Octave的编程环境,Matlab也可以实现这些算法.最好不要使用C++,java,python等编程环境,使用Octave的编程环境可以更快的入手机器学习。
总的来讲无监督学习就是把数据交给算法让他自动进行处理
以上是关于初识机器学习的主要内容,如果未能解决你的问题,请参考以下文章