统计模式识别
Posted byxdaz
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了统计模式识别相关的知识,希望对你有一定的参考价值。
在人工智能领域中,计算机视觉这一分支关注开发分析图像内容的算法。人们使用了种种关于图像处理的方法,这里,我们只考虑其中之一:统计模式识别。这不仅仅是因为它是应用最广的方法,而且对它的理解是彻底理解各种模式识别过程的基础,不管这一过程是怎样实现的。统计模式识别认为图像可能包含一个或多个物体,并且每个物体属于若干事先定义的类型、范畴或模式类之一。虽然模式识别可以用多种方法实现,但我们只关心用数字图像处理技术对它的实现。
在给定一幅含有多个物体的数字图像的条件下,模式识别过程由三个上要阶段组成(见下图)。第一个阶段称为图像分割或物体分离阶段。在该阶段中检测出各个物体,并把它们的图像和其余景物分离。
第二个阶段称为特征抽取阶段。在该阶段中对物体进行度氧。一个度量是指一个物体某个可度量性质的度量值,而特征是一个或多个度量的函数。计算特征是为了对物体的一些重要特征进行定量估计。特征抽取过程产生了一组特征 ,把它们组合在一起 ,就形成了特征向量。这种被大大减少了的信息(与原始图像相比)代表了后续分类决策必须依靠的全部知识。引进一个 维空间的概念是很有益的,这个空间包含了所有可能的 维特征向量。因此任意一个特定物体都对应于特征空间中的一点。
模式识别的第三个阶段是分类。它的输出仅仅是一种决策,确定每个物体应该归属的类别。每个物体被识别为某一特定类型,它是通过一个分类过程加以实现的。每个物体被指定属于若干预先定义好的组(类)中的某一个组、这些组代表了预期存在于图像中物体的所有可能类别。如果把指派物体归到一个不正确的类,就产生一个分类错误。错分类发生的概率称为误判率。
分类只以特征向量为依据。在下两章中,我们探讨由统计决策理论导出的分类技术。
图 8-2-1 模式识别的三个阶段
一、模式识别的一个例子
统计模式识别的基本概念可以用、一个例子来很好地说明。假定我们想实现一个对在传送带上传送的水果进行分类的系统。实际的分类由一个如下图所示的活动的挡板来实现、当挡板降下时将各个水果拨出传送带,并分别落入相应的运输箱里。我们假定待分类的水果是樱桃、苹果、柠檬和葡萄。我们需要一个图像处理系统,它能够观察移动中的水果,对它们进行分类,井能够及时地降下相应的挡板以实现水果的正确装箱。
图 8-2-2 水果分类系统
我们可以在传送带上方安装一个数字摄像机井在计算机里实现分类决策。对这个例子来说,我们测量每个水果的两个特点;直径和颜色。计算机程序处理每幅数字化图像并且计算水果的直径(单位毫米)和一个表示颜色的参数。
假定我们使用彩色摄像机,程序计算每个物体在红、绿、蓝通道的亮度。于是,我们得到一个特征(例如:红一绿亮度比),对黄色水果取小值,红色水果取大值,我们把这个参数称为红色程度。
下图所示是由直径和红色程度这两个参数定义的2维特征空间以及4种水果中每一种应呈现的聚类现象。通过特征空间中确定合适的决策分界线,我们把空间划分成若干区域,每个区域代表一个类。这样,我们就建立了一个分类规则。
图 8-2-3 特征空间
任一个水果的属性在进人摄像机视野范围时被测量,它的特征对应于2维特征空间中的某一点。根据这个点在特征空间里的位置,该水果被指定为四类中的一类。分类决策一旦确定,机械装置降下挡板,把水果拨人恰当的包装箱中。
虽然上述系统在水果包装工业中还没被广泛采用,但它起到了说明统计模式识别的作用。在下两章中统计值在系统的设计和操作中的作用会说明得更清楚。但到目前为止,这一点是很清楚的,即每类水果在特征空间里产生了一个概率密度函数分布PDF。而决策分界线可以通过这些PDF的相互作用,按避免误分类或最大限度减少误分类的原则加以确定。
二、模式识别系统的统计
一个模式识别系统的设计通常由以下的5个步骤的方式实现:物体检测器设计,特征选择,分类器设计,分类器训练和性能评估。
1.物体检测器设计,作用是选择能够将图像中各个物体分离开的景物分割算法。
2.特征选择,作用是确定能够最好地辨别物体类型的物体性质以及如何度量这些性质的方法。
3.分类器设计,作用是建立分类算法的数学基础并选择所使用的分类器的结构类型。
4.分类器训练 ,作用是确定分类器中各种可调整的参数 (决策界限等)使之适应被分类的物体。
5.性能评估,作用是估计各种可能的错分类率的预期值。
物体检测器是一个在复杂景物中分类出各个物体图像的算法。这种分离物体的过程称为图像分割或景物分割,是本章讨论的话题。特征选择确定物体的哪些属性(尺寸、形状等)需要计算,以便能够用它最好地区别各种物体。分类器设计为分类过程确定数学基础。分类器本身的各种可调参数(决策阈值等)在分类器训练阶段确定。除此之外通常还要求估计出在使用该系统时分类错误率的期望值,因此增设了性能评估这一步骤。
以上是关于统计模式识别的主要内容,如果未能解决你的问题,请参考以下文章