3第三章线性判别函数.ppt
《3第三章线性判别函数.ppt》由会员分享,可在线阅读,更多相关《3第三章线性判别函数.ppt(50页珍藏版)》请在三一办公上搜索。
1、第三章 线性判别函数 郝红卫,1,第三章 线性判别函数,3.1 引言3.2 线性判别函数和决策面3.3 广义线性判别函数3.4 两类线性可分情况3.5 梯度下降算法3.6 感知准则函数最小化3.7 松弛算法3.8 最小平方误差方法,第三章 线性判别函数 郝红卫,2,引 言,贝叶斯公式中需要知道类条件概率密度函数和先验概率在实际中,我们通常只能得到有限数目的样本因此,分类器的设计过程可以分为两步:利用样本集估计先验概率和类条件概率密度函数将估计值代入贝叶斯公式,完成分类器设计,第三章 线性判别函数 郝红卫,3,引 言,先验概率的估计:比较容易。比如,癌细胞识别中,可以根据细胞病理检查的统计结果得
2、到正常与异常的大致比例。密度函数的估计:非常困难。只能根据样本进行估计。,第三章 线性判别函数 郝红卫,4,引 言,解决的思路:迎难而上参数估计:假定密度函数是种分布,即分布形式已知但参数未知,通过训练样本估计分布的参数 比如,假定分布为正态,可以利用样本估计其均值和方差。非参数方法:分布的形式未知,直接通过样本估计密度函数的形式和参数另辟蹊径,第三章 线性判别函数 郝红卫,5,引 言,在对正态分布下贝叶斯决策理论的讨论中,我们看到,在正态假设下,可以得到一些简单方便的判别函数。如:最小距离,线性判别函数。我们可以绕过对密度的估计,直接得到判别函数在所有的判别函数中,最简单的是线性判别函数,第
3、三章 线性判别函数 郝红卫,6,引 言,线性判别函数的优点:特定条件下为最优 正态、独立、等方差,可以通过对特征的选择来达到相对简单,容易实现 牺牲精度,享受简便性能和代价的折中是复杂方法的基础 线性判别函数中的基本方法可以推广到非线性判别函数中,第三章 线性判别函数 郝红卫,7,引 言,思路:假定判别函数的形式已知:线性判别函数未知的是判别函数的参数参数由样本约束:合适的参数将使错误率最小通过训练样本确定其参数:找出使训练样本错误率最小的参数最优化方法,第三章 线性判别函数 郝红卫,8,引 言,设计线性分类器的主要步骤:根据需求确定准则函数,使准则函数的值反映分类器的性能(如错误率),其极值
4、解对应最优决策用最优化技术求出准则函数的极值解将该极值解代入线性判别函数的表达式中,完成分类器的设计,第三章 线性判别函数 郝红卫,9,线性判别函数和决策面,线性判别函数是x各分量的线性组合:g(x)=wtx+w0 其中 x=(x1,x2,xd)t 是d维特征向量 w=(w1,w2,wd)t 是d维权向量(weight vector)w0 为常数,称为偏置(bias)或阈值权(threshold weight),第三章 线性判别函数 郝红卫,10,线性判别函数和决策面,通常,我们需要设计c个判别函数,分别与c个类别相对应先来看两类的情况:Decide 1 if g(x)0 and 2 if g
5、(x)-w0 and 2 otherwise,第三章 线性判别函数 郝红卫,11,线性判别函数和决策面,第三章 线性判别函数 郝红卫,12,线性判别函数和决策面,方程 g(x)=0 定义了一个决策面,它将分属两类的样本分开。假设x1和x2都在决策面H上,则有:wtx1+w0=wtx2+w0 wt(x1-x2)=0 这表明,w和超平面H上任一向量正交,即w是H的法向量。超平面H将特征空间分成两部分,即对1类的决策域R1和对2类的决策域R2。由于当x在R1中时,g(x)为正,所以法向量是指向R1的,故称R1中的x在H的正侧,称R2中的x在H的负侧。,第三章 线性判别函数 郝红卫,13,线性判别函数
6、和决策面,判别函数g(x)是特征空间中某点到超平面距离的一种代数度量。如图所示:,第三章 线性判别函数 郝红卫,14,线性判别函数和决策面,可以将x表示成其中 xp:是x在H上的投影向量 r:是x到H的垂直距离 w/|w|:是w方向上的单位向量,第三章 线性判别函数 郝红卫,15,线性判别函数和决策面,代入g(x):或写作:,第三章 线性判别函数 郝红卫,16,线性判别函数和决策面,若x为原点,则 g(x)=w0 因此原点到超平面H的距离为 r0=w0/|w|总之,利用线性判别函数进行分类,就是用一个超平面把特征空间分割成两个决策区域。超平面的方向由权向量w确定。超平面的位置由阈值权w0确定。
7、判别函数正比于x到超平面的代数距离(带正负号)。当x在超平面正侧时,g(x)0;在负侧时,g(x)0。,第三章 线性判别函数 郝红卫,17,线性判别函数和决策面,多类情况可以把c类问题看做c个两类问题,其中第i个问题是用线性判别函数把属于1类的点与不属于1类的点分开可以用c(c-1)/2个线性判别函数,把样本分成c个类别,每个线性判别函数只对其中的两个类别分类。两种方法都会产生无法确定其类别的区域,如图所示:,第三章 线性判别函数 郝红卫,18,线性判别函数和决策面,第三章 线性判别函数 郝红卫,19,线性判别函数和决策面,我们可以定义c个判别函数 如果对于所有的j i 有gi(x)gj(x)
8、,则把 x 归为 i 类;如果gi(x)=gj(x),则拒识。这样得到的分类器称为“线性机器”(linear machine)。线性机器把特征空间分成c个决策区域,当x在Ri中时,gi(x)具有最大值。如果Ri和Ri是相邻的,则它们的分界就是超平面H的一部分,其定义为gi(x)=gj(x)。,第三章 线性判别函数 郝红卫,20,线性判别函数和决策面,共有c个决策区域,实际中,超平面的个数往往会少于c(c-1)/2个。如图所示:,第三章 线性判别函数 郝红卫,21,广义线性判别函数,线性判别函数可以写成 通过增加高次项,可以得到二次判别函数(quadratic discriminant func
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 线性 判别函数

链接地址:https://www.31ppt.com/p-6059063.html