机器学习-白板推导系列(三十)-生成模型(Generative Model)
Posted Paul-Huang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习-白板推导系列(三十)-生成模型(Generative Model)相关的知识,希望对你有一定的参考价值。
机器学习-白板推导系列(三十)-生成模型(Generative Model)
30.1 生成模型的定义
前面所详细描述的模型以浅层的机器学习为主。本章将承上启下引出后面深度机器学习的部分。本小节,主要讲述的是什么是生成模型,它是不是只是生成样本,生成数据?它的任务是什么?精准的定义是什么?
这个问题实际上在之前的章节中有过详细的介绍。这里更进一步总结。之前讲过的简单的生成模型,包括:
- 高斯混合分布(GMM),GMM的主要任务是聚类,属于非监督学习;
- 而监督学习中的生成模型,最简单的有朴素贝叶斯模型,主要任务是分类。
- Logistics regression(LR)模型主要是对 P ( Y = 1 ∣ X ) P(Y=1|X) P(Y=1∣X)或 P ( Y = 0 ∣ X ) P(Y=0|X) P(Y=0∣X)条件概率进行建模,并不关心样本 X X X是什么样。
生 成 模 型 关 注 点 是 样 本 分 布 本 身 , 解 决 的 问 题 与 任 务 无 关 , 对 样 本 分 布 建 模 。 {\\color{red}生成模型关注点是样本分布本身,解决的问题与任务无关,对样本分布建模}。 生成模型关注点是样本分布本身,解决的问题与任务无关,对样本分布建模。
比如:
- 简单学习中,先对 P ( X , Y ) P(X,Y) P(X,Y)建模,然后求 ∑ X P ( Y ∣ X ) \\sum_X P(Y|X) ∑XP(Y∣X)来计算条件概率。
- 在无监督学习中,直接对 P ( X ) P(X) P(X)建模。有时 P ( X ) P(X) P(X)非常的复杂,直接对 P ( X ) P(X) P(X)建模非常的困难。引入隐变量(Latent) Z Z Z,对 P ( X , Z ) P(X,Z) P(X,Z)建模,然后 P ( X ) = ∑ Z P ( X ∣ Z ) P(X) = \\sum_Z P(X|Z) P(X)=∑ZP(X∣Z)。
生 成 模 型 关 注 的 是 样 本 分 布 本 身 , 是 对 样 本 数 据 本 身 建 模 {\\color{red}生成模型关注的是样本分布本身,是对样本数据本身建模} 生成模型关注的是样本分布本身,是对样本数据本身建模, 所 以 一 定 和 概 率 分 布 有 关 , 往 往 被 称 之 为 “ 概 率 生 成 模 型 ” 。 {\\color{red}所以一定和概率分布有关,往往被称之为“概率生成模型”。} 所以一定和概率分布有关,往往被称之为“概率生成模型”。
30.2 任务角度:监督 vs 非监督
按照任务分可以将生成模型实现的功能分成:
分
类
,
回
归
,
标
记
,
降
维
,
聚
类
,
特
征
学
习
,
密
度
估
计
,
生
产
数
据
。
{\\color{red} 分类,回归,标记,降维,聚类,特征学习,密度估计,生产数据。}
分类,回归,标记,降维,聚类,特征学习,密度估计,生产数据。
监
督
{
概
率
模
型
{
判
别
模
型
(
P
(
Y
∣
X
)
)
:
L
R
,
M
E
M
M
,
C
R
F
;
生
成
模
型
:
N
B
,
M
M
,
T
M
,
N
P
M
,
F
M
;
非
概
率
模
型
:
P
L
A
,
S
V
M
,
K
N
N
,
T
r
e
e
M
o
d
e
l
,
N
N
.
(30.1.1)
\\color{blue}\\begin{matrix} 监督\\left\\{\\begin{matrix} 概率模型\\left\\{\\begin{matrix} 判别模型(P(Y|X)):LR, MEMM, CRF;\\\\ 生成模型:NB, MM, TM, NPM, FM;\\end{matrix}\\right.\\\\ 非概率模型 : PLA, SVM, KNN, Tree\\, Model,NN.\\end{matrix}\\right.\\end{matrix}\\tag{30.1.1}
监督⎩⎨⎧概率模型{判别模型(P(Y∣X)):LR,MEMM,CRF;生成模型:NB,MM,TM,NPM,FM;非概率模型:PLA,SVM,KNN,TreeModel,NN.(30.1.1)
监
督
{
概
率
模
型
:
生
成
模
型
;
非
概
率
模
型
:
P
C
A
,
L
S
A
,
K
m
e
a
n
;
(30.1.2)
\\color{blue}\\begin{matrix} 监督\\left\\{\\begin{matrix} 概率模型: 生成模型;\\\\ 非概率模型 : PCA, LSA,Kmean;\\end{matrix}\\right.\\end{matrix}\\tag{30.1.2}
监督{概率模型:生成模型;非概率模型:PCA,LSA,Kmean;(30.1.2)
-
判别模型
判别模型是对条件概率分布建模 P ( Y ∣ X ) P(Y|X) P(Y∣X),典型的有Logistics Regression,最大熵马尔可夫模型(MEMM),条件随机场(CRF)。 -
非概率模型
包括PLA,Support Vector Machines(支持向量机),KNN(K近邻网络),Tree Model,神经网络(Neural Network)。注意神经网络非概率模型,但是和判别模型并不是非黑即白的关系,也可以起到判别模型的作用。其大部分情况是发挥着非概率模型的作用。
-
非监督任务
- 非监督任务中,概率模型都是生成模型,和前文描述的监督学习中的概率模型是一样的。
- 非概率模型包括:PCA(SVD分解),LSA(潜语义分析),K-means,Auto-encoder。
-
生成模型
4.1 浅 层 的 生 成 模 型 \\color{red}浅层的生成模型 浅层的生成模型
1. Naive Bayes \\textbf{1. Naive Bayes} 1. Naive Bayes,此模型非常简单,主要是服从朴素贝叶斯假设。朴素贝叶斯假设描述的是: 样 本 空 间 各 维 度 之 间 相 互 独 立 \\color{red}样本空间各维度之间相互独立 样本空间各维度之间相互独立, P ( X ∣ Y ) = ∏ i = 1 p P ( x i ∣ Y ) ( x ∈ R p ) P(X|Y)=\\prod_{i=1}^p P(x_i|Y)(x\\in R^p) P(X∣Y)=∏i=1pP(xi∣Y)(x∈Rp)。2. Mixture Model \\textbf{2. Mixture Model} 2. Mixture Model,其中的典型代表是混合高斯模型(GMM),此模型主要是用于 聚 类 \\color{red} 聚类 聚类。模型可以简要的表示为 P ( X ∣ Z ) ∼ P(X|Z)\\sim P(X∣Z)∼ Gaussian Distribution.
3. Time-series Model \\textbf{3. Time-series Model} 3. Time-series Model,最基础的有隐马尔可夫模型(HMM),卡曼滤波(Kalman Filter),粒子滤波(Particle Filter)。
4. Non-Parameteric Model \\textbf{4. Non-Parameteric Model} 4. Non-Parameteric Model以上是关于机器学习-白板推导系列(三十)-生成模型(Generative Model)的主要内容,如果未能解决你的问题,请参考以下文章