模式识别-第5讲-线性判别函数.ppt
《模式识别-第5讲-线性判别函数.ppt》由会员分享,可在线阅读,更多相关《模式识别-第5讲-线性判别函数.ppt(76页珍藏版)》请在三一办公上搜索。
1、模式识别,授课教师 薛耀红,第5讲 线性判别函数(1),本节课主要内容,线性判别函数和决策面 Fisher准则3 感知准则,1 线性判别函数和决策面,线性判别函数是决策论模式识别方法中的一种重要的基本方法,是形式最简单的判别函数,由于它具有计算简单,在一定条件下能够实现最优分类的性质,因此在实际中得到了广泛的应用。此外,许多其它决策论识别方法也可用判别函数来研究(非线性判别函数),它也是研究神经网络的基础。现在我们就从线性判别函数开始介绍统计模式识别的各种方法。,在统计模式识别方法中,首先应把能代表模式的那些特征抽取出来,构成一个代表这个模式的特征向量,表示为当我们观察待分类模式时,每次观察到
2、的样本都是不同的,他们可以看成是随机产生的。所以每次抽取到的模式特征都应看成是随机变量,从而代表这些模式的 n 维向量也应是随机向量。,所以,如果根据以往大量的观察,知道模式类别的分布,从而能找出n 维空间中模式类之间的分界,就能解决模式的分类问题。这在实际上是一个通过给定样本的学习过程。简便起见,在本章中我们假定抽取到的模式样本的边界是“整齐”而不混杂的,而且以后遇到的待分类模式基本上不超过学习样本的分布范围,从而利用这些样本得出的分类边界是无误差的。为找出这些模式之间的分界面,可以利用判别函数来进行。对于n 维空间中的 c 个模式类别各给出一个由 n 个特征组成的单值函数,这叫做判别函数。
3、在 c 类的情况下,我们共有 c个判别函数,记为,判别函数,假设对一模式X已抽取n个特征,表示为:,模式识别问题就是根据模式X的n个特征来判别模式属于1,2,c 类中的那一类。,例如下图:三类的分类问题,它们的边界线就是一个判别函数,判别函数,判别函数包含两类:一类 是线性判别函数:线性判别函数 广义线性判别函数(所谓广义线性判别函数就是把非线性判别函数映射到另外一个空间变成线性判别函数)非线性判别函数分段线性判别函数二次判别函数,判别函数,判别函数的性质假如一个模式 X 属于第 i 类,则有而如果这个模式在第 i 类和第 j 类的分界面上,则有事实上,这是由 n 维模式降为1维或1个数的一种
4、变换。线性判别函数是所有模式特征的线性组合,表示为,二类情况下的线性判别函数,可将其任意分类,或拒绝,用其可以构造一个二类模式的线性分类器,如图所示。,二类情况下,决策面与模式向量的几何关系 是决策面方程,它是两类模式的分界,对于二维空间的情况,它是一条直线。下面,对一些关系作几何解释,如图所示。,广义线性判别函数,这样一个非线性判别函数通过映射,变换成线性判别函数。,判别函数的一般形式:,广义线性判别函数,例:如右图。,广义线性判别函数,要用二次判别函数才可把二类分开:,广义线性判别函数,从图可以看出:在阴影上面是1类,在阴影下面是2类,结论:在X空间的非线性判别函数通过变换到Y空间成为线性
5、的,但X变为高维空间.,设计线性分类器的主要步骤,一组具有类别标志的样本集 X=x1,x2,xn 或增广样本集Y。确定一个准则函数J,满足:a.是样本集w,w0,或a的函数;b.J的值反映分类器的性能,极值解对应最好策略。用最优化技术求出准则函数的极值w*,w0*,或a*。这样就可以得到线性判别函数,2.Fisher线性判别函数,在以后的统计模式识别方法中,维数或特征数是一个很大的问题,因此,降低维数有时就成为处理实际问题的关键。Fisher线性判别函数法就是其中一种,是R.A.Fisher(1936)在他的一篇论文中提出来的,其基本思想是把 d 维模式投影到一条通过原点的直线上,把维数压缩到
6、1。参照如图所示的例子,进行分析。,基于这个例子可以看到,投影线的方向起着至关重要的作用。下面着重讨论如何从数学上寻求最优的投影线方向。首先讨论从 d 维空间到 1 维空间的数学变换,从几何上看,就是相对应的 到方向为 的直线上的投影。寻找最好的投影方向即是寻找最好的变换向量 的问题。,这里建立一个准则函数,它能反映不同类别模式在 直线上投影分离程度的好坏。综合上述考虑,希望两类模式特征向量投影均值之差越大越好;同时希望同类模式特征向量的投影内部尽量密集。定义Fisher准则函数寻找使 分子尽可能大,而分母尽可能小,也就是使 尽可能大的 作为投影方向。,将 变为 的显函数,称为 Rayleig
7、h比,其具有以下性质:,a 是一个实数;的极值与 的大小无关,只与 的方向有关。下面求准则函数的极大值。将标量 对向量 求导并令其为零向量,注意到 的分子分母均为标量,利用二次型关于向量求导的公式可得:,上式表明:是矩阵 相应于特征值 的特征向量(本特值)。,由于我们的目的是寻求最好的投影方向,的比例因子对此并无影响,因此,可得,线性可分性讨论如下的两个问题 对于4个二维样本,其在平面上的分布如图所示。若把每个样本任意分到 两种类别之一 或,举出其中的两种线性不可分情况。验证 N 个 d 维样本线性可分的概率阈值是,3感知准则函数,线性可分性,样本的规范化 二类模式的线性分类器的决策规则为引入
8、增广样本向量和广义权向量,可将其任意分类,或拒绝,代入,决策规则可变为 取可得 叫做规范化增广样本向量,为方便起见仍用 表示,解向量和解区,解向量:在线性可分情况下,满足的权向量称作解向量。解区:解向量往往不唯一,而是由无穷多个解向量组成的区域。我们称这样的区域为解区。,对解区的限制对解区加以限制的目的在于使解向量更可靠。因为越靠近解区中间的解向量越能对新的样本正确分类。同时也可避免求解向量 的算法不致收敛到解区边界的某点上。,为了解线性不等式(已规范化)需要构造一个准则函数。这里我们介绍一种常用的准则函数即所谓的感知准则函数,定义为如下的形式:是由于使用权向量 而被误分类的样本集合。,感知准
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 线性 判别函数

链接地址:https://www.31ppt.com/p-6585333.html