《线性判别分析》PPT课件.ppt
《《线性判别分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《线性判别分析》PPT课件.ppt(28页珍藏版)》请在三一办公上搜索。
1、线性判别分析(LDA),基本思想,线性判别分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间,即把高维空间中的数据点投影到一条直线上去,将多维降为一维。并且要求投影后各样本的类间散布距离最大,同时类内散布距离最小。,LDA 二分类问题公式推导,假设A和B为分类明确的两类症状。在总体A中观察了P例,在总体B中观察了q例,每一例记录了n个指标,分别记为x1,x2,xn。令y是n个指标的一个线性函数,即 y=w1x1+w2x2+wnxn y=wTx 其中w1,w2,wn 是待估计的未知系数。我们称上述线性函数是线性判别法的判别函数。,假设用来区分二分类的直线(投影函数)为:类别i的样本均值:类别
2、i投影后的均值为:投影后,类别内点之间的分散程度(方差)为:最终我们可以得到一个下面的公式,称为准侧函数。,为了找到最有利于分类的的方向W,还需要建立一个准侧函数:,LDA,我们分类的目标是找到一个最优化的W,使得类别内的点距离越近越好(集中),类别间的点越远越好。,分母表示每一个类别内的方差之和,方差越大表示一个类别内的点越分散,分子为两个类别各自的中心点的距离的平方,我们最大化J(w)就可以求出最优的w,定义:(1)样本类内离散度矩阵Si和总类内离散度矩阵,(2)样本类间离散度矩阵 SB,LDA,LDA,然后将J(w)分子和分母分别化为:这样目标优化函数可以化成下面的形式:,瑞利商,根据广
3、义Rayleigh商的性质:,J(w)的极值与w的大小无关,只与w的方向有关。,Fisher算法步骤总结:由Fisher线性判别式 求解向量 的步骤:把来自两类 的训练样本集 分成 和 两个子集 和。由,i=1,2,计算 mi。由 计算投影后各类的类内离散度矩阵 计算类内总离散度矩阵 计算 Sw 的逆矩阵。由 求解w*。,幼儿不同年龄段的身高体重指标:,经典Fisher线性判别分析方法,LDA,LDA,LDA,Sw奇异问题的解决方法:,R-LDA PCA+LDA N-LDA D-LDA,R-LDA,由于Sw总是半正定的,为了使之正定,可以将另外一个正定的对角矩阵与之相加,以两者之和代替Sw,即
4、是:,上式中a为任意正实数,I为单位矩阵,显然对于任意的正实数a,Sw总是非奇异的,用Sw代替Fisher准则函数中的Sw。用上述方法就可以求解最优投影方向矩阵。在R-LDA中,对角矩阵的系数a的选择没有理论依据,可以选择多个不同的数值进行分类实验,通过实验结果来选择一个最优的值。用Sw代替Sw的确可以消除Sw的奇异性,但代替之后,通过最大化Fisher准则函数选取的最优投影方向矩阵就变成原始最优投影方向矩阵的一个近似矩阵,且选择不同的系数a会导致得到不同的最优投影方向矩阵。,Sw=Sw+a I,为了保证Sw是非奇异矩阵,需要t+c个训练样本,当特征维数t特别大时,在实际应用中往往难以满足要求
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性判别分析 线性 判别分析 PPT 课件
链接地址:https://www.31ppt.com/p-4848093.html