模式识别清华-课件第三章.docx
《模式识别清华-课件第三章.docx》由会员分享,可在线阅读,更多相关《模式识别清华-课件第三章.docx(11页珍藏版)》请在三一办公上搜索。
1、第三章非参数判别分类方法学习指南学习这一章最主要的是了解它在模式识别技术中所处的地位。前一章重点学习的贝叶斯决策具有理论指导的意义,同时也指明了根据统计参数分类决策的方向。沿这条路走就要设法获取样本统计分布的资料,要知道先验概率,类分布概率密度函数等。然而在样本数缺乏条件下要获取准确的统计分别也是困难的。这样一来人们考虑走另一条道路,即根据训练样本集提供的信息,直接进行分类器设计。这种方法绕过统计分布状况的分析,绕过参数估计这一环,而企图对特征空间实行划分,称为非参数判别分类法,即不依赖统计参数的分类法。这是当前模式识别中主要使用的方法,并且涉及到人工神经元网络与统计学习理论等多方面,是本门课
2、最核心的章节之一。非参数判别分类方法的核心是由训练样本集提供的信息直接确定决策域的划分方法。这里最重要的概念是分类器设计用种训练与学习的过程来实现。机器自动识别事物的能力通过训练学习过程来实现,其性能通过学习过程来提高,这是模式识别、人工神经元网络中最核心的内容。学习这一章要进一步体会模式识别中以确定准那么函数并实现优化的计算框架。由于决策域的分界面是用数学式子来描述的,如线性函数,或各种非线性函数等。因此确定分界面方程,这包括选择函数类型与确定最正确参数两个局部。i般说来选择函数类型是由设计者确定的,但其参数确实定那么是通过一个学习过程来实现的,是一个叠代实现优化的过程。因此本章从最简单的函
3、数类型讲起,再扩展到非线性函数。同学们学习的重点要放在线性判别函数的根本内容上,然后再注意如何扩展到非线性函数的应用上去。该章的学习最好通过概念的反复推敲与思考,以加深对重要概念的理解,另一方面通过实验,亲自体验设计模式识别系统的完整过程,对学习才会更加真切。数学是模式识别中不可缺少的工具,希望大家学习时,遇到的数学方面的内容要通过再学习、复习等进一步掌握,如线性代数、矩阵的特征值分解与特征向量等概念的运用上起到很重要的作用。通过这门课学习加深对这些数学工具的理解与运用熟练程度是会终身受益的。对于数学推导理解程度的要求,会对增强同学分析问题解决问题的能力有好处。学习目的(1)通过本章学习掌握模
4、式识别中最重要的非参数判别分类法的原理(2)掌握机器自学习的原理,自学习功能已不仅在模式识别中应用,目前经常用机器学习这个词以涉及更为广泛的内容。(3)学习线性分类器的三种典型算法,这三种算法各自形成体系,分别形成了传统模式识别、人工神经元网络以及统计学习理论(4)用近邻法进行分类(5)通过相应数学工具的运用进一步提高运用数学的本领本章重点(1)非参数判别分类器的根本原理,与参数判别分类方法的比拟(2)线性分类器的三种典型方法一一以FiSher准那么为代表的传统模式识别方法,以感知准那么函数为代表的机器自学习方法,以及支持向量机代表的统计学习理论。(3)近邻法的工作原理及其改良(4)线性分类器
5、扩展到非线性分类器,两类别分类方法与多类别分类方法本章难点(DFiSher准那么函数,其中用到向量点积,带约束条件的拉格朗日乘子法以及矩阵的特征值、特征向量等数学工具。要求对这些数学工具较深理解。(2)感知器准那么函数提出利用错误提供信息实现叠代修正的学习原理(3)支持向量机方法设计约束条件为不等式的极值优化问题(4)三种不同典型方法的优缺点比拟(5)近邻法的改良知识点非参数判别分类方法的基本原理一一有监督学习方法近邻法,线性分类器改进的近邻法U非线性分类器的扩展七 分段线性七特征映射方法实现非 *线性分类器t课前思考题:(1)机器能否像人类一样通过例证教育认知事物,修正观念中的错误的成分?(
6、2)机器学习过程中有教师吗?谁是教师?(3)什么叫线性分类器?按照基于最小错误率贝叶斯决策,什么条件下才能用线性分 类器?在上一章中我们讨论了贝叶斯决策理论和统计判别方法。从原理上说贝叶斯决策理论采用了在d维特征空间中样本分布的最一般描述方式,即统计分布来描述,并且采用分类器中最重要的指标一 错误率作为产生判别函数和决策面的依据,因此它给出了最一般情况下适用的“最优”分类器设计方法, 对各种不同的分类器设计技术在理论上都有指导意义。但是直接使用贝叶斯决策理论需要首先得到有关 样本总体分布的知识,具体说来包括各类先验概率P(3 J及类条件概率密度函数,从而可以计算出样 本的后验概率P(3X),并
7、以此作为产生判别函数的必要数据,设计出相应的判别函数与决策面。 3. 2. 1在线性判别函数的根本概念设样本d维特征空间中描述,则两类别问题中线性判别函数的一般形式可表示成g(X)=WX+W0(3-1)其中而3。是一个常数,称为阈值权.相应的决策规则可表示成,g(X)o,g(X)V0,或 X)= 0,则决策X1则决策Xe2可将其任意分类或拒绝.g(X)=O就是相应的决策面方程,在线性判别函数条件下它对应d维空间的一个超平面.WTX+Wn=O(3-3)为了说明向量W的意义,我们假设在该决策平面上有两个特征向量X与X2,则应有WX1+w0=WX2+w0Wt(X1-X2)=O(3-4)其中(Xl-X
8、2)也是一个向量.(3-4)式表明向量H与该平面上任两点组成的向量(XI-X2)正交,因此W就是该超平面的法线向量:这就是向量4的几何意义。而晨X)也就是d维空间中任一点X到该决策面距W0 网表示商的代数度量,该决策平面将这两类样本按其到该面距离的正负号确定其类别。至于Wo则体现该决策面在特征空间中的位置,当WO=O时,该决策面过特征空间坐标系原点,而W。时,则了坐标原点到该决策面的距离.有的同学可能对(3-1)公式表示线性判别函数不太理解,这可从线性方程的表示法说起,设二维空间Wo。一直线方程表示为:w2+wll+w0x其中Wl和*2分别是Xi和X2的系数,WO是直线方程的参数项,由于Xi和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 清华 课件 第三
链接地址:https://www.31ppt.com/p-6945075.html