机器学习介绍

Posted 2020-10-24 Zz_moi

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习介绍相关的知识，希望对你有一定的参考价值。

机器学习：让机器去学习

传统解决思路：设定规则，定义“垃圾邮件”，让计算机去执行规则。

问题：对很多问题规则难以定义，比如识别一只猫或人脸识别。且规则总在不断变化。

新思路：借鉴人类学习的过程，资料->学习归纳总结->知识经验积累->对类似问题做出正确反应

机器学习：

model即f(x)

机器学习的应用：

搜索引擎根据输入的部分关键字联想出你最可能想搜索的内容

浏览商品时，最有可能购买的商品

可能喜欢的音乐，图书，文章

语音识别，人脸识别

医疗诊断，市场分析，金融领域

无人驾驶

宇宙探索，药物研发

训练数据有标记或答案

分类任务classification
- 二分类：不是a就是b。e.g. 判断是猫还是狗。银行是否给客户发放信用卡。
- 多分类：多个种类中选一个。e.g.手写数字识别。银行对客户进行信用评级。

　　一些复杂任务可转换为分类任务，如无人车任务，时刻在方向盘各种角度和刹车/油门深浅的组合中选一个。

　　一些回归问题可以被看成分类问题 --> 将连续数值划分区间成一个个类别。

算法：k近邻，线性回归，多项式回归，逻辑回归，SVM，决策树和随机森林。

训练数据无标记

聚类分析cluster：对无标记数据分类
数据降维
- 特征提取：将与结果无关的特征扔掉
- 特征压缩：PCA，尽量少损失信息将高维压成低维->1）提高效率不影响准确率。 2）方便可视化

　　　　　　有时特征间的关联特别强，如上图中所有的点都有一个整体的趋势。可将这些点用红线涵盖。此时则将二维压缩为了一维。　

一部分数据有标记，另一部分没 --> 现实中更常见，因各种原因缺失数据。

通常先用无监督学习处理数据（使无标签数据因与有标签数据一类而获得标签），再用监督学习手段训练模型做预测。

采取行动->获得反馈(奖赏或惩罚)->改进算法(Agent)->...

通过一轮一轮的行动->反馈的循环中来调整Agent增强自己的智能。

如AlphaGo，机器人，无人驾驶。

批量学习batch learning/offline learning
- 特点：1）先准备好训练数据，2）模型后续不会再根据新数据来自我优化
- 优：简单
- 缺：如何适应环境变化？ -> 问题自身在不断变化。
- 解：定期更新数据库，重新批量学习
- 又缺：1）每次重新，运算量巨大。2）环境变化太快，重训练模型跟不上，如股市每分每秒都在变换
- 需：及时将新数据用于改进模型
在线学习online learning