机器学习：监督学习和无监督学习

Posted 2020-09-23 mthoutai

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习：监督学习和无监督学习相关的知识，希望对你有一定的参考价值。

**************************************

注：本系列博客是博主学习Stanford大学 Andrew Ng 教授的《机器学习》课程笔记。博主深感学过课程后，不进行总结非常easy遗忘。依据课程加上自己对不明确问题的补充遂有此系列博客。

本系列博客包含线性回归、逻辑回归、神经网络、机器学习的应用和系统设计、支持向量机、聚类、将维、异常检測、推荐系统及大规模机器学习等内容。

**************************************

机器学习定义

机器学习是人工智能的一个分支，目标是赋予机器一种新的能力。（专门研究计算机如何模拟或实现人类的学习行为，以获取新的知识或技能，又一次组织已有的知识结构使之不断改善自身的性能。）机器学习的应用非常广泛。比如大规模的数据挖掘（网页PV数据。医疗记录等），无人驾驶飞机、汽车，手写手别，大多数的自然语言处理任务。计算机视觉，推荐系统等。

机器学习有非常多定义。广为人知的有例如以下两条：

ArthurSamuel (1959): Machine Learning: Field of study that gives computers theability to learn without being explicitly programmed.

TomMitchell (1998) : Well-posed Learning Problem: A computer program is said tolearn from experience E with respect to some task T and some performance measureP, if its performance on T, as measured by P, improves with experience E.

样例：对于一个垃圾邮件识别的问题，将邮件分类为垃圾邮件或非垃圾邮件是任务T，查看哪些邮件被标记为垃圾邮件哪些被标记为非垃圾邮件是经验E，正确识别的垃圾邮件或非垃圾邮件的数量或比率是评測指标P。

监督学习

对具有概念标记（分类）的训练样本进行学习。以尽可能对训练样本集外的数据进行标记（分类）预測。这里，全部的标记（分类）是已知的。因此，训练样本的岐义性低。

监督学习是训练神经网络和决策树的最常见技术。这两种技术（神经网络和决策树）高度依赖于事先确定的分类系统给出的信息。

房屋价格预測-回归(Regression): 预測连续的输出值（价格)

技术分享