1.不同输出空间上的学习
二分类问题
多分类问题
回归问题
结构化的问题(有趣且复杂,可从多分类的问题衍生而来)
...
2.不同数据标签上的学习
有监督的学习
无监督的学习
无监督的多分类 <=> 聚类 (比监督式的困难,但是更实用)
无监督的应用:
- 聚类
文章 => 主题
用户画像 => 用户群 - 密度分析
地区交通报告 => 危险地段 - 异常检测
网络日志 => 入侵警报
半监督的学习
应用(标注代价太高):
人脸识别
药品效能检测
强化学习
序列的过程
通过reward(另外一个输出)告诉模型这个行为好还是不好
3.不同的protocol(学习方式)上的学习
batch learning:用一批一批的data进行学习
online learning:循序学习(按顺序一笔一笔的data进行学习,e.g. PLA,RL)
active learning:通过问问题来主动学习(通常用于标注代价太高时)
4.不同的输入空间上的学习
具体特征(有预处理,domain knowledge)
原始特征
数字图片的pixel就是一种原始特征
栗子:手写辨识问题
=> 特征工程
抽象特征
比如:用户ID,广告ID等这类抽象特征,通常需要通过机器和人来抽取具体特征