机器学习概念理解与基本知识
1、机器学习是什么
在数据上通过算法总结出规律模式,应用在新数据上做预测。
2、机器学习基本概念
2.1、不同类型的问题
- 监督学习:分类问题(选择)、回归问题(计算)
- 无监督学习:聚类问题(抱团)、关联规则
- 强化学习:从环境行为到映射的学习
2.2、机器学习工业应用方向
- 自然语言处理
- 计算机视觉
- 语音识别
- 电商推荐与预估
- 数据挖掘
3、机器学习基本流程与工作环节
3.1、机器学习应用阶段
- 数据预处理(数据采样、数据切分、特征抽取、特征选择、降维)
- 模型学习(超参选择、交叉验证、结果评估、模型选择、模型训练)
- 模型评估(分类、回归、排序评估标准)
- 模型上线
4、机器学习中的评估指标
4.1、机器学习的目标
- 拿到有泛化能力的好模型
4.2、机器学习的评估方法(获得可靠的测试集数据)
- 留出法(1/5~1/3)
- K折交叉验证法
- 自助法
4.3、机器学习的评估度量标准
- 分类问题(错误类、精度、召回率/准确率、混淆矩阵、F1值、AUC)
- 回归问题(MAE、MSE、RMSE、R平方)
5、机器学习算法一览
- 分类(K最近邻、逻辑回归、朴素贝叶斯、支持向量机、树模型)
- 回归(线性回归、多项式回归、岭回归、树模型回归)
- 聚类(K-means、层次聚类、密度聚类、GMM)
- 关联规则(Fpgrowth)