计算机科学理论模式识别课件c.ppt
模式识别 Pattern Recognition,余 莉电话:76434(O),61430(M)E-mail:(民网)(军网),课程对象,信息工程专业本科生的专业课学院硕士研究生的学位课 学院博士研究生的必修课之一,学习方法,着重理解基本概念基本方法算法原理注重理论与实践紧密结合,基本要求,基本:完成课程学习,通过考试,获得学分。提高:能够将所学知识和内容用于课题研究,解决实际问题。飞跃:通过模式识别的学习,改进思维方式,为将来的工作打好基础,终身受益。,课程内容及安排,第一章 引论(2学时)第二章 聚类分析(4学时)第三章 判别域代数界面方程法(4学时)第四章 统计判决(4学时)第五章 统计决策中的学习与估计(4学时)第六章 最近邻方法(2学时)第七章 特征提取与选择(2学时)复习(2学时)实验 上机实验(8学时)作业 每章课后布置习题考核 笔试(70%)+实验(20%)+作业(10%),教材及参考教材,教材孙即祥,现代模式识别,国防科技大学出版社,2002.1参考教材J.P.Marques de Sa,模式识别-原理、方法及应用,清华大学出版社,2002.11 边肇祺等,模式识别(第二版)清华大学出版社 2000.1Sergios Theodoridis,李晶皎等译,模式识别(第三版),电子工业出版社,2006,第一章引 论,1.1模式和模式识别,1.1.1 模式和模式识别的概念识别是人类的基本行为模式识别(Pattern Recognition)使用计算机来辨别事物。机器识别,计算机识别,机器自动识别。,1.2 模式识别系统,概 念,样本(Sample):一个具体的研究(客观)对象。如某人写的一个汉字,一幅图片等。模式(Pattern):对客体(研究对象)特征的描述(定量的或结构的描述),是取自客观世界的某一样本的测量值的集合(或综合)。模式类(Class):具有某些共同特性的模式的集合。,特征矢量:设一个研究对象的 个特征量测量值分别为,我们将它们作为一个整体来考虑,让它们构成一个 维特征矢量。特征空间:各种不同取值的特征矢量的全体构成了 维特征空间。注:特征矢量就是特征空间中的一个点。,(颜色(绿/红),似圆度),颜色(绿/红),似圆度,模式识别:确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。模式分类的过程。,1.1.2 机器与人类识别事物原理的比较,人类:具有抽象抽象概念的能力总结规律,抽象出概念机器:缺乏抽象能力基本方法是计算,1.1.3 模式识别技术的应用领域,生物学自动细胞学、染色体特性研究、遗传研究天文学天文望远镜图像分析、自动光谱学经济学股票交易预测、企业行为分析医学心电图分析、脑电图分析、医学图像分析,文字识别(Character Recognition)OCR(Optical Character Recognition)智能交通(Intelligent Traffic)车牌、车型语音识别(Speech recognition)翻译机,身份识别等目标识别ATR(Automaic Target Recognition),(1)确定患者的病症:测量体温、血压,化验血沉,询问临床表现(模式采集);(2)医生运用医学知识和个人经验(分类判决规则),根据主要病症(特征提取/选择),作出诊断(分类判决):该患者(模式样本)患了何种疾病(模式类)。,例子1:诊断,1.2 模式识别系统,1.2 模式识别系统,数据采集特征提取,正确率测试,数据采集特征提取,改进分类识别规则,二次特征提取与选择,分类识别,改进采集提取方法,二次特征提取与选择,改进特征提取与选择,制定改进分类识别规则,待识对象,训练样本,人工干预,识别结果,例子2:苹果和香蕉的分类,颜色(绿/红),似圆度,1.2 模式识别系统,18,纸币识别器对纸币按面额进行分类 面额,例子3:纸币识别系统,5元10元20元50元100元,19,长度(mm)宽度(mm)5元1366310元1417020元1467050元15170100元15677,例子3:纸币识别系统,20,磁性金属条位置(大约)5元有 54/8210元有 54/8720元有 57/8950元有 60/91100元有 63/93,例子3:纸币识别系统,21,数据采集、特征提取:长度、宽度、磁性、磁性的位置等等,特征选择:长度、位置,分类识别:确定纸币的面额,例子3:纸币识别系统,各类空间(Space)的概念,对象空间,模式空间,特征空间,类型空间,模式采集:从客观世界(对象空间)到模式空间的过程称为模式采集。,特征提取和特征选择:由模式空间到特征空间的变换和选择。,类型判别:特征空间到类型空间所作的操作。,1.3 特征矢量和特征空间,所有样本观测数据构成的空间,1.3 特征矢量和特征空间,1.4 模式识别方法,统计判决句法结构模糊判决逻辑推理神经网络,(1)统计判决,理论基础:概率论,数理统计模式描述方法:特征向量主要方法几何分类:线性分类,非线性分类统计分类:Bayes决策无教师的分类:聚类分析主要优点1)比较成熟2)能考虑干扰噪声等影响3)识别模式基元能力强主要缺点1)对结构复杂的模式抽取特征困难2)不能反映模式的结构特征,难以描述模式的性质3)难以从整体角度考虑识别问题,(2)句法结构,理论基础:形式语言,自动机技术模式描述方法:符号串,树,图模式判定:是一种语言,用一个文法表示一个类,m类就有m个文法,然后判定未知模式遵循哪一个文法。主要优点1)识别方便,可以从简单的基元开始,由简至繁。2)能反映模式的结构特征,能描述模式的性质。3)对图象畸变的抗干扰能力较强。主要缺点当存在干扰及噪声时,抽取特征基元困难,且易失误。,(3)模糊判决,理论基础:模糊数学模式描述方法:模糊集合 A=(a,a),(b,b),.(n,n),模式判定:是一种集合运算。用隶属度将模糊集合划分为若干子集,m类就有m个子集,然后根据择近原则分类。主要优点由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体的与主体的特征,从而允许样本有相当程度的干扰与畸变。主要缺点准确合理的隶属度函数往往难以建立,故限制了它的应用。,(4)逻辑推理,理论基础:演绎逻辑,布尔代数模式描述方法:字符串表示的事实模式判定:是一种布尔运算。从事实出发运用一系列规则,推理得到不同结果,m个类就有m个结果。主要优点已建立了关于知识表示及组织,目标搜索及匹配的完整体系。对需要众多规则的推理达到识别目标确认的问题,有很好的效果。缺点当样本有缺损,背景不清晰,规则不明确甚至有歧义时,效果不好。,(5)神经网络,理论基础:神经生理学,心理学模式描述方法:以不同活跃度表示的输入节点集模式判定:是一个非线性动态系统。通过对样本的学习建立记忆,然后将未知模式判决为其最接近的记忆。主要优点可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样本有较大的缺损、畸变。主要缺点模型在不断丰富与完善中,目前能识别的模式类还不够多。,