判别函数及几何分类法.ppt
《判别函数及几何分类法.ppt》由会员分享,可在线阅读,更多相关《判别函数及几何分类法.ppt(129页珍藏版)》请在三一办公上搜索。
1、第3章 判别函数及几何分类法,第3章 判别函数及几何分类法,3.1 判别函数3.2 线性判别函数3.3 广义线性判别函数3.4 线性判别函数的几何性质3.5 感知器算法3.6 梯度法3.7 最小平方误差算法3.8 非线性判别函数,3.1 判别函数,聚类分析法(第七章),判决函数法,几何分类法确定性事件分类(第三章),概率分类法随机事件分类(第二章),线性判决函数法,统 计 决 策 方 法,非线性判决函数法,复习与引申:,若分属于1,2的两类模式可用一方程d(X)=0来划分,那么称d(X)为判别函数,或称判决函数、决策函数。,3.1 判别函数(discriminant function),直接用
2、来对模式进行分类的准则函数。,例:一个二维的两类判别问题,模式分布如图示,这些分属于1,2两类的模式可用一直线方程 d(X)=0来划分。,为坐标变量,,为方程参数。,式中:,图3.2 两类二维模式的分布,1判别函数的定义,若,则,若,则 类;,若,则 类;,或拒绝,将某一未知模式 X 代入:,维数=3时:判别边界为一平面。维数3时:判别边界为一超平面。,d(X)表示的是一种分类的标准,它可以是1、2、3维的,也可以是更高维的。,判别界面的正负侧,是在训练判别函数的权值时确定的。,2判别函数正负值的确定,图3.3 判别函数正负的确定,1)判决函数d(X)的几何性质。它可以是线性的或非线性的函 数
3、,维数在特征提取时已经确定。,如:已知三维线性分类 判决函数的性质就确定了判决函数 的形式:,3.确定判别函数的两个因素,例:非线性判决函数,2)判决函数d(X)的系数。用所给的模式样本确定。,3.2 线性判别函数,3.2.1 线性判别函数的一般形式,将二维模式推广到n维,线性判别函数的一般形式为:,(3-2),式中:,增广向量的形式:,式中:,为增广权向量,,为增广模式向量。,权向量,3.2.2 线性判别函数的性质,1.两类情况,对M个线性可分模式类,1,2,M,有三种划分方式:,2.多类情况,两分法,两分法,两分法特例,用线性判别函数将属于i类的模式与其余不属于i类的模式分开。,识别分类时
4、:,对某一模式区,di(X)0的条件超过一个,或全部的di(X)0,分类失效。相当于不确定区(indefiniteregion,IR)。,此法将 M 个多类问题分成M个两类问题,识别每一类均需M个判别函数。识别出所有的M类仍是这M个函数。,例3.1 设有一个三类问题,其判别式为:,现有一模式,X=7,5T,试判定应属于哪类?并画出三类模式的分布区域。,解:将X=7,5T代入上三式,有:,三个判别界面分别为:,图示如下:,步骤:,a)画出界面直线。,b)判别界面正负侧:找特殊点带入。,c)找交集。,例3.2 已知di(X)的位置和正负侧,分析三类模式的分布区域。,一个判别界面只能分开两个类别,不
5、能把其余所有的类别都分开。判决函数为:。这里。,则 类,而 在判别 类模式时不起作用。,如:对一个三类问题,如果,,识别分类时:,判别函数性质:,与 值无关。,例3.3 一个三类问题,三个判决函数为:,解:计算得,可写成:,x2,x1,d23(X)=0,d12(X)=0,d13(X)=0,5,5,3,0,分类时:每分离出一类,需要与I 有关的M-1个判决函数;要分开M类模式,共需M(M-1)/2个判决函数。对三类问题需要3(3-1)/2=3个判决函数。即:每次从M类中取出两类的组合:,例3.4 已知dij(X)的位置和正负侧,分析三类模式的分布区域。,当i/j两分法中的判别函数dij(X),可
6、以定义为,时,那么di(X)dj(X)就相当于多类情况2中的dij(X)0。,因此对具有判别函数,的M类情况,判别函数性质为:,或:,识别分类时:,判别界面需要做差值。对i类,应满足:di其他所有dj,除边界区外,没有不确定区域。,特点:,是第二种情况的特例。由于dij(X)=di(X)dj(X),若在第三种情况下可分,则在第二种情况下也可分,但反过来不一定。,把 M 类情况分成了(M-1)个两类问题。并且 类的判别界面全部与 类的判别界面相邻(向无穷远处延伸的区域除外)。,特别的定义,例3.5 一个三类模式(M=3)分类器,其判决函数为:,试判断X0=1,1T属于哪一类,且分别给出三类的判决
7、界面。,解:,判决界面如图所示。,类的判决函数:,类的判决函数:,例3.6 已知判决界面的位置和正负侧,分析三类模式的分布 区域。,(1)明确概念:线性可分。,一旦线性判别函数的系数Wk被确定以后,这些函数就可以作为模式分类的基础。,3.小结,(2)分法的比较:,对于M类模式的分类,两分法共需要M个判别函数,但 两分法需要M(M-1)/2个。当时M3时,后者需要更多个判别式(缺点),但对模式的线性可分的可能性要更大一些(优点)。,原因:,一种类别模式的分布要比M-1类模式的分布更为聚集,分法受到的限制条件少,故线性可分的可能性大。,两分法,若只有di(X)0,其他d(X)均0,则判为i 类,两
8、分法:,定义,1非线性多项式函数 非线性判别函数的形式之一是非线性多项式函数。,3.3 广义线性判别函数,目的:对非线性边界:通过某映射,把模式空间X变成X*,以便将X空间中非线性可分的模式集,变成在X*空间中线性可分的模式集。,设一训练用模式集,X在模式空间X中线性不可分,非线性判别函数形式如下:,(3-9),式中 是模式X的单值实函数,。,fi(X)取什么形式及d(X)取多少项,取决于非线性边界的复杂程度。,广义形式的模式向量定义为:,(3-10),这里X*空间的维数k高于X空间的维数n,(3-9)式可写为,上式是线性的。讨论线性判别函数并不会失去一般性的意义。,(3-11),随着小样本学
9、习理论和支持向量机的迅速发展,广义线性判别函数的“维数灾难”问题在一定程度上找到了解决的办法。,非线性变换可能非常复杂。,问题:,维数大大增加:维数灾难。,例3.7 假设X为二维模式向量,fi(X)选用二次多项式函数,原判别函数为,定义:,d(X)线性化为:,即:,广义线性判别函数:,3.4 线性判别函数的几何性质,3.4.1 模式空间与超平面,模式空间:以n维模式向量X的n个分量为坐标变量的欧氏空间。,模式向量的表示:点、有向线段。,线性分类:用d(X)进行分类,相当于用超平面d(X)=0把模式空 间分成不同的决策区域。,2.讨论,1.概念,式中,。,设判别函数:,超平面:,(1)模式向量X
10、1和X2在超平面上,W0是超平面的法向量,方向由超平面的负侧指向正侧。,设超平面的单位法向量为U:,(2)X不在超平面上,将X向超平面投影得向量Xp,构造向量R:,r:X到超平面的垂直距离。有,(r),判别函数d(X)正比于点X到超平面的代数距离。,X到超平面的距离:,点X到超平面的代数距离(带正负号)正比于d(X)函数值。,(3)X在原点,得,超平面的位置由阈值权wn+1决定:,wn+1 0时,原点在超平面的正侧;,wn+1 0时,原点在超平面负侧;,wn+1=0 时,超平面通过原点。,3.4.2 权空间与权向量解,1.概念,权空间:以 的权系数为 坐标变量的(n+1)维欧氏空间,增广权向量
11、的表示:点、有向线段。,2.线性分类,判别函数形式已定,只需确定权向量。,类:X11,X12,X1p,类:X21,X22,X2q,设增广样本向量:,使d(X)=0将1和 2分开,需满足,给2的q个增广模式乘以(1),统一为,其中,样本的规范化过程。,对每个已知的X,d(X)=0在权空间确定一个超平面,共(p+q)个。,在权空间中寻找向量W使判别函数d(X)能把1类和2类分开,就是寻找一个权向量,使得上式中的(p+q)个不等式同时成立,因此满足条件的权向量必然在(p+q)个超平面的正侧的交迭区域里(即W的解区)。,X:规范化增广样本向量。,例:二维权空间,超平面的方程为:,超平面:过原点的直线;
12、,阴影部分:解区。,3.4.3 二分法,二分法(Dichotomies):用判别函数d(X)将给定的N个模式 分成两类的方法。是一种基本的分类方法。,判别函数的不同分类能力可以通过二分法总数衡量。,若不限制判别函数的形式,N个n维模式用判别函数分成两类的二分法总数为2N。,若限定用线性判别函数,并且样本在模式空间是良好分布的,即在n维模式空间中没有(n+1)个模式位于(n1)维子空间中,可以证明,N个n维模式用线性判别函数分成两类的方法总数,即线性二分法总数为,或线性二分法概率:,只要模式的个数N小于或等于增广模式的维数(n+1),模式类总是线性可分的,,例:4个良好分布的2维模式,若用线性判
13、别函数分类,线性二分法总数:,线性二分法概率:,图3.14 线性二分法的概率,将=2时的N值定义为阈值N0,称为二分法能力,即,通过N0,可以对任意N个样本的线性可分性进行粗略估计。,3.5 感知器算法,1.概念理解,训练:用已知类别的模式样本指导机器对分类规则进行反复修 改,最终使分类结果与已知类别信息完全相同的过程。,1)训练与学习,只要求出权向量,分类器的设计即告完成。本节开始介绍如何通过各种算法,利用已知类别的模式样本训练出权向量W。,对线性判别函数,当模式维数已知时,判别函数的形式实际上已经确定,如:三维时,3)感知器 对一种分类学习机模型的称呼,属于有关机器学习的仿生学领域中的问题
14、,由于无法实现非线性分类而下马。但“赏罚概念(reward-punishment concept)”得到广泛应用。,2)确定性分类器,处理确定可分情况的分类器。通过几何方法将特征空间分解为对应不同类的子空间,又称为几何分类器。,2.感器算法(perception approach),两类线性可分的模式类:,设,其中,,应具有性质,对样本进行规范化处理,即2类样本全部乘以(1),则有:,感知器算法通过对已知类别的训练样本集的学习,寻找一个满足上式的权向量。,感知器算法步骤:,(1)选择N个分属于1和 2类的模式样本构成训练样本集 X1,XN 构成增广向量形式,并进行规范化处理。任取权向量初始 值
15、W(1),开始迭代。迭代次数k=1。,(2)用全部训练样本进行一轮迭代,计算WT(k)Xi 的值,并修 正权向量。,分两种情况,更新权向量的值:,c:正的校正增量。,分类器对第i个模式做了错误分类,,权向量校正为:,统一写为:,(3)分析分类结果:只要有一个错误分类,回到(2),直至 对所有样本正确分类。,分类正确时,对权向量“赏”这里用“不罚”,即权向量不变;分类错误时,对权向量“罚”对其修改,向正确的方向转换。,感知器算法是一种赏罚过程:,3.收敛性,收敛性:经过算法的有限次迭代运算后,求出了一个使所有样本都能正确分类的W,则称算法是收敛的。,可以证明感知器算法是收敛的。收敛条件:模式类别
16、线性可分。,例3.8 已知两类训练样本,解:所有样本写成增广向量形式;进行规范化处理,属于2的样本乘以(1)。,用感知器算法求出将模式分为两类的权向量解和判别函数。,任取W(1)=0,取c=1,迭代过程为:,第一轮:,有两个WT(k)Xi 0的情况(错判),进行第二轮迭代。,第二轮:,第三轮:,第四轮:,该轮迭代的分类结果全部正确,故解向量,相应的判别函数为:,当c、W(1)取其他值时,结果可能不一样,所以感知器算法的解不是单值的。,判别界面d(X)=0如图示。,采用多类情况3的方法时,应有:,4.感知器算法用于多类情况,对于M类模式应存在M个判决函数:,算法主要内容:,设有 M 种模式类别:
17、,设其权向量初值为:,第k次迭代时,一个属于i类的模式样本 X 被送入分类器,计算所有判别函数,训练样本为增广向量形式,但不需要规范化处理。,分二种情况修改权向量:,若第l个权向量使,则相应的权向量作调整,即:,可以证明:只要模式类在情况3判别函数时是可分的,则经过有限次迭代后算法收敛。,,c为正的校正增量,例3.9 设有三个线性可分的模式类,三类的训练样本分别为,若 则权向量不变;,现采用多类情况3的方式分类,试用感知器算法求出判别函数。,解:增广向量形式:,注意,这里任一类的样本都不能乘以(1)。,任取初始权向量,;c=1,第一次迭代:,三个权向量都需要修改:,第二次迭代:,第三次迭代:,
18、修改为权向量。,以上进行的一轮迭代运算中,三个样本都未正确分类,进行下一轮迭代。,第四次迭代:,在第五、六、七迭代中,对所有三个样本都已正确分类。,权向量的解:,判别函数:,设函数f(Y)是向量 的函数,则f(Y)的梯度定义为:,3.6 梯度法,梯度的方向是函数 f(Y)在Y点增长最快的方向,梯度的模是f(Y)在增长最快的方向上的增长率(增长率最大值)。,1.梯度概念,梯度向量的最重要性质之一:指出函数 f 在其自变量增加时,增长最快的方向。,3.6.1 梯度法基本原理,显然:负梯度指出了最陡下降方向。梯度算法的依据。,即:,2.梯度算法,设两个线性可分的模式类1和2的样本共N个,2类样本乘(
19、-1)。将两类样本分开的判决函数d(X)应满足:,梯度算法的目的仍然是求一个满足上述条件的权向量,主导思想是将联立不等式求解W的问题,转换成求准则函数极小值的问题。,N个不等式,准则函数的选取原则:具有唯一的最小值,并且这个最小值发生在W TXi0时。,用负梯度向量的值对权向量W进行修正,实现使准则函数达到极小值的目的。,定义一个对错误分类敏感的准则函数J(W,X),在J的梯度方向上对权向量进行修改。一般关系表示成从W(k)导出W(k+1):,其中c是正的比例因子。,(1)将样本写成规范化增广向量形式,选择准则函数,设置初始权向量W(1),括号内为迭代次数k=1。,权向量修正为:,迭代次数k加
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 判别函数 几何 分类法

链接地址:https://www.31ppt.com/p-5243629.html