模式识别原理(Pattern Recognition)概念系统特征选择和特征
Posted blogpro
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了模式识别原理(Pattern Recognition)概念系统特征选择和特征相关的知识,希望对你有一定的参考价值。
§1.1 模式识别的基本概念
一、广义定义
1、模式:一个客观事物的描述,一个可用来仿效的完善的例子。
2、模式识别:按哲学的定义是一个“外部信息到达感觉器官,并被转换成有意义的感觉经验”的过程。
例:识别热水、字迹等
二、狭义的定义
1、模式:对某些感兴趣的客体的定量的或结构的描述。模式类是具有某些共同特性的模式的集合。
2、模式识别:研究一种自动技术,依靠这种技术,计算机将自动地(或人尽量少地干涉)把待别识模式分配到各自的模式类中去。注意: 狭义的“模式”概念——是对客体的描述,不论是待识别客体,还是已知的客体。 广义的“模式”概念——是指“用于效仿的完善例子
三、相关的计算机技术
1、目前的计算机建立在诺依曼体系基础之上。
1946年:美籍匈牙利数学家冯·诺依曼提出了关 于计算机组成和工作方式的基本设想:数字计算机 的数制采用二进制;计算机按照程序顺序执行,即 “程序存储”的概念。
1949年:研制出第一台冯·诺依曼式计算机 。
1956年:第一次人工智能(artificial intelligence) 研讨会在美国召开。
2、第五代人工智能型计算机
本质区别:主要功能将从信息处理上升为知识处理(学习、联想、推理、解释问题),使计算机具有人类的某些智能。研制工作从80年代开始,目前尚未形成一致结论 。
几种可能的发展方向: 神经网络计算机--模拟人的大脑思维。 生物计算机--运用生物工程技术、蛋白分子作芯片。 光计算机--用光作为信息载体,通过对光的处理来完成对信息的处理。
四、研究和发展模式识别的目的
提高计算机的感知能力,从而大大开拓计算机的应用。
§1.2 模式识别系统一、
简例:建立感性认识
以癌细胞识别为例,了解机器识别的全过程。
1、信息输入与数据获取
将显微细胞图像转换成数字化细胞图像,像素的 值反映光密度的 大小,又称灰度 数字图像。数字 化细胞图像是计 算机分析的原始 数据基础。
2、数字化细胞图像的预处理与区域划分
预处理的目的:
(1)去除在数据获取时引入的噪声与干扰。
(2)去除所有夹杂在背景上的次要图像,突出主要的待识别的细胞图像。
例:平滑、图像增强等数字图像处理技术。
区域划分的目的:找出边界,划分出三个区域,为特征抽取做准备。
3、细胞特征的抽取、选择和提取
目的:为了建立各种特征的数学模型,以用于分类。① 抽取特征 :原始采集数据,第一手资料,特征数据 量大。是特征选择和提取的依据。
例:对一个细胞抽取33个特征 ,建立一个33维的空间X,每个细胞可通过一个33维随机向量表示,即把一个物理实体“细胞”变成了一个数学模型“33 维随机向量”,也即33维空间中的一点。
② 特征选择:在原始特征基础上选择一些主要特征作为判别用的特征。 ③ 特征提取:采用某种变换技术,得出数目上比原来少的综合性特征作为分类用,称为特征维数压缩,习惯上亦称特征提取。
§1.3 模式识别概况
一、模试识别发展简介
二十世纪五十年代开始、六十年代兴起并迅速发 展,七十年代初奠定理论基础 。
二、模式识别分类
1、从理论上分类 ① 统计模式识别 以模式集在特征空间中分布的类概率密度函数为基础,对总体特征进行研究。包括判决函数法和聚类分析法。
② 结构模式识别(句法模式识别)
把复杂模式分化为较简单的子模式乃至基元,各 层次之间的关系 通过“结构法”来描述,相当于语言 中的语法。用小而简单的基元与语法规则来描述大而 复杂的模式。
③ 模糊模式识别
以隶属度为基础,运用模糊数学中的“关系”概念和运算进行分类。隶属度反映的是某一元素属于某集合的程度。
④ 智能模式识别
人工智能与模式识别相结合的产物,有二个分支: a) 与人工神经网络相结合:接近于生理性模拟,从而 达到对形象思维的模拟。 b) 基于知识的逻辑性推理:源于对人类逻辑思维的模 拟,是抽象思维的范畴。
2、从实现方法来分: ① 有监督(有导师)识别:利用判别函数进行分类判 别。需要有足够的先验知识。 ② 无监督(无导师)识别:用于没有先验知识的情况 下,采用聚类分析的方法。
§1.4 特征选择和特征提取
一、概述:两种数据测量情况
① 由于测量上可实现性的限制或经济上的考虑,所获得的测量值为数不多。 ② 能获得的性质测量值很多。如果全部直接作为分类特征,耗费机时,且分类效果不一定好。有人称之为“特征维数灾难”。
特征选择和提取的目的:经过选择或变换,组成识别特征,尽可能保留分类信息,在保证一定分类精度的前提下,减少特征维数,使分类器的工作即快又准确。
§1.5 模式识别的应用
一、高速公路上的汽车收费系统:按车型收费方式
1、提取车辆外形几何参数进行处理分析,实现分类。如视频检测方法、红外检测方法。
2、测量车辆的其他物理参数(噪声、振动、压重等)来实现分类。如动态称重、电磁感应等。
3、直接识别车辆身份的方法实现分类。如电子标签、视频牌照识别等。
二、生物识别
根据每个人独有的可以采样和测量的生物学特征(生理特征)和行为学特征进行身份识别的技术。
1 指纹识别:最早、最成熟的识别技术。
2 掌纹识别:研究纹线上某几个点的幅值(灰度值)、线长与线所对应的角之比等特征。
3 脸谱识别:
4 视网膜识别:
5 根据动力学特征进行识别:
以上是关于模式识别原理(Pattern Recognition)概念系统特征选择和特征的主要内容,如果未能解决你的问题,请参考以下文章
模式识别(Pattern Recognition)学习笔记--何为模式识别
模式识别(Pattern Recognition)学习笔记(三十)--随机森林(Random Forest)
模式识别与机器学习 (Pattern Recognization and Maching Learning)(PRML)
模式识别(Pattern Recognition)学习笔记(二十八)-- 决策树