机器学习-白板推导系列(三十)-生成模型(Generative Model)

Posted Paul-Huang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习-白板推导系列(三十)-生成模型(Generative Model)相关的知识,希望对你有一定的参考价值。

机器学习-白板推导系列(三十)-生成模型(Generative Model)

30.1 生成模型的定义

前面所详细描述的模型以浅层的机器学习为主。本章将承上启下引出后面深度机器学习的部分。本小节,主要讲述的是什么是生成模型,它是不是只是生成样本,生成数据?它的任务是什么?精准的定义是什么?

这个问题实际上在之前的章节中有过详细的介绍。这里更进一步总结。之前讲过的简单的生成模型,包括:

  • 高斯混合分布(GMM),GMM的主要任务是聚类,属于非监督学习
  • 而监督学习中的生成模型,最简单的有朴素贝叶斯模型,主要任务是分类。
  • Logistics regression(LR)模型主要是对 P ( Y = 1 ∣ X ) P(Y=1|X) P(Y=1X) P ( Y = 0 ∣ X ) P(Y=0|X) P(Y=0X)条件概率进行建模,并不关心样本 X X X是什么样。

生 成 模 型 关 注 点 是 样 本 分 布 本 身 , 解 决 的 问 题 与 任 务 无 关 , 对 样 本 分 布 建 模 。 {\\color{red}生成模型关注点是样本分布本身,解决的问题与任务无关,对样本分布建模}。

比如:

  • 简单学习中,先对 P ( X , Y ) P(X,Y) P(X,Y)建模,然后求 ∑ X P ( Y ∣ X ) \\sum_X P(Y|X) XP(YX)来计算条件概率。
  • 在无监督学习中,直接对 P ( X ) P(X) P(X)建模。有时 P ( X ) P(X) P(X)非常的复杂,直接对 P ( X ) P(X) P(X)建模非常的困难。引入隐变量(Latent) Z Z Z,对 P ( X , Z ) P(X,Z) P(X,Z)建模,然后 P ( X ) = ∑ Z P ( X ∣ Z ) P(X) = \\sum_Z P(X|Z) P(X)=ZP(XZ)

生 成 模 型 关 注 的 是 样 本 分 布 本 身 , 是 对 样 本 数 据 本 身 建 模 {\\color{red}生成模型关注的是样本分布本身,是对样本数据本身建模} 所 以 一 定 和 概 率 分 布 有 关 , 往 往 被 称 之 为 “ 概 率 生 成 模 型 ” 。 {\\color{red}所以一定和概率分布有关,往往被称之为“概率生成模型”。}


30.2 任务角度:监督 vs 非监督

按照任务分可以将生成模型实现的功能分成: 分 类 , 回 归 , 标 记 , 降 维 , 聚 类 , 特 征 学 习 , 密 度 估 计 , 生 产 数 据 。 {\\color{red} 分类,回归,标记,降维,聚类,特征学习,密度估计,生产数据。}
监 督 { 概 率 模 型 { 判 别 模 型 ( P ( Y ∣ X ) ) : L R , M E M M , C R F ; 生 成 模 型 : N B , M M , T M , N P M , F M ; 非 概 率 模 型 : P L A , S V M , K N N , T r e e   M o d e l , N N . (30.1.1) \\color{blue}\\begin{matrix} 监督\\left\\{\\begin{matrix} 概率模型\\left\\{\\begin{matrix} 判别模型(P(Y|X)):LR, MEMM, CRF;\\\\ 生成模型:NB, MM, TM, NPM, FM;\\end{matrix}\\right.\\\\ 非概率模型 : PLA, SVM, KNN, Tree\\, Model,NN.\\end{matrix}\\right.\\end{matrix}\\tag{30.1.1} {(P(YX)):LR,MEMM,CRF;:NB,MM,TM,NPM,FM;:PLA,SVM,KNN,TreeModel,NN.(30.1.1)
监 督 { 概 率 模 型 : 生 成 模 型 ; 非 概 率 模 型 : P C A , L S A , K m e a n ; (30.1.2) \\color{blue}\\begin{matrix} 监督\\left\\{\\begin{matrix} 概率模型: 生成模型;\\\\ 非概率模型 : PCA, LSA,Kmean;\\end{matrix}\\right.\\end{matrix}\\tag{30.1.2} {::PCA,LSA,Kmean;(30.1.2)

  1. 判别模型
    判别模型是对条件概率分布建模 P ( Y ∣ X ) P(Y|X) P(YX),典型的有Logistics Regression,最大熵马尔可夫模型(MEMM),条件随机场(CRF)。

  2. 非概率模型
    包括PLA,Support Vector Machines(支持向量机),KNN(K近邻网络),Tree Model,神经网络(Neural Network)。

    注意神经网络非概率模型,但是和判别模型并不是非黑即白的关系,也可以起到判别模型的作用。其大部分情况是发挥着非概率模型的作用。

  3. 非监督任务

    • 非监督任务中,概率模型都是生成模型,和前文描述的监督学习中的概率模型是一样的。
    • 非概率模型包括:PCA(SVD分解),LSA(潜语义分析),K-means,Auto-encoder。
  4. 生成模型
    4.1 浅 层 的 生 成 模 型 \\color{red}浅层的生成模型
    1.   Naive   Bayes \\textbf{1. Naive Bayes} 1. Naive Bayes,此模型非常简单,主要是服从朴素贝叶斯假设。朴素贝叶斯假设描述的是: 样 本 空 间 各 维 度 之 间 相 互 独 立 \\color{red}样本空间各维度之间相互独立 P ( X ∣ Y ) = ∏ i = 1 p P ( x i ∣ Y ) ( x ∈ R p ) P(X|Y)=\\prod_{i=1}^p P(x_i|Y)(x\\in R^p) P(XY)=i=1pP(xiY)(xRp)

    2.   Mixture   Model \\textbf{2. Mixture Model} 2. Mixture Model,其中的典型代表是混合高斯模型(GMM),此模型主要是用于 聚 类 \\color{red} 聚类 。模型可以简要的表示为 P ( X ∣ Z ) ∼ P(X|Z)\\sim P(XZ) Gaussian Distribution.

    3.   Time-series   Model \\textbf{3. Time-series Model} 3. Time-series Model,最基础的有隐马尔可夫模型(HMM)卡曼滤波(Kalman Filter)粒子滤波(Particle Filter)

    4.   Non-Parameteric   Model \\textbf{4. Non-Parameteric Model} 4. Non-Parameteric Model以上是关于机器学习-白板推导系列(三十)-生成模型(Generative Model)的主要内容,如果未能解决你的问题,请参考以下文章

    机器学习-白板推导系列(三十二)-变分自编码器(VAE,Variational AutoEncoder)

    机器学习-白板推导系列笔记(十九)-贝叶斯线性回归

    机器学习入门

    机器学习白板,最小二乘法,线性回归,矩阵表达

    详解核方法-背景介绍白板推导系列笔记

    详解降维-背景白板推导系列笔记