国科大人工智能学院《计算机视觉》课 —底层视觉—图像分割

Posted 肉丸不肉

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了国科大人工智能学院《计算机视觉》课 —底层视觉—图像分割相关的知识,希望对你有一定的参考价值。

一、早期的图像分割方法:阈值法、基于边缘信息的分割方法

图像分割:把图像分成互不重叠的区域并提取出感兴趣目标的技术和过程。

图像分割的基本依据:区域内的一致性、区域间的不一致性

阈值法


局部阈值法将图像分块,分别用全局阈值方法分割,最后再综合

基于边缘的分割方法

  • 检测边缘
  • 根据边缘将图像分割成不同的区域

霍夫变换(Hough transform)

  • 是图像中检测直线的一种方法,也可以检测其他参数化的物体,比如圆或者椭圆等。


二、基于特定理论的方法:Mean Shift、Nomalized Cut、Graph Cut

1. K-Means


GMM 高斯混合模型:是多个高斯分布函数的线性组合,理论上可以拟合出任意类型的分布

  • 假设:数据点满足不同参数下的高斯分布
  • 用两个参数来描述聚类的形状均值、标准差
  • 标准差的存在允许聚类的形状可以是任何种类的椭圆形(不再局限于圆形)
  • 如果数据点符合某个高斯分布,它就会被归类为那个聚类
  • 权重的引入为同一点属于多个聚类找到了解决方案
  • 与K-Means相比,GMM每一步迭代的计算量很大
  • 基于EM算法,有可能陷入局部极值,需要经过多次迭代
2. EM 期望最大化:为了找到每个聚类的高斯参数






3. Mean-Shift 均值移动

  • 核心思想:找到概率密度梯度为零的采样点,并以此作为特征空间聚类的模式点
  • 算法流程:
  • (0) 确定窗口大小h
  • (1) 计算m(x)
  • (2) 如果m(x)小于一个给定的阈值,结束循环;否则,计算新的x,继续执行(1)

  • Mean-Shift优缺点
4. Graph Cut 图割:图像用图来表示




5. Normalized Cut:分类、图像分割







6. 用Graph Cut 求解 能量极小化 问题:多标记分类



三、基于深度神经网络的图像分割:FCN(全卷积)、SegNet、DeepLab


往年试题:

  1. 混合高斯模型GMM

  2. 图像分割:Mean-Shift、Normalized cut

以上是关于国科大人工智能学院《计算机视觉》课 —底层视觉—图像分割的主要内容,如果未能解决你的问题,请参考以下文章

国科大人工智能学院《计算机视觉》课 —底层视觉—图像分割

国科大人工智能学院《计算机视觉》课 —底层视觉—特征点提取描述与匹配

国科大人工智能学院《计算机视觉》课 —底层视觉—特征点提取描述与匹配

国科大人工智能学院《计算机视觉》课 —底层视觉—特征点提取描述与匹配

国科大人工智能学院《计算机视觉》课 —运动视觉—运动表达和行为识别

国科大人工智能学院《计算机视觉》课 —运动视觉—运动表达和行为识别