第七章 特征提取与选择.ppt
《第七章 特征提取与选择.ppt》由会员分享,可在线阅读,更多相关《第七章 特征提取与选择.ppt(35页珍藏版)》请在三一办公上搜索。
1、第七章 特征提取与选择,特征形成特征提取特征选择,目的:,7.1 概 述,直接选择法分支定界法;用回归建模技术确定相关特征等方法。变换法在使判据Jmax的目标下,对n个原始特征进行变换降维,即对原n维特征空间进行坐标变换,然后再取子空间。主要方法有:基于可分性判据的特征选择基于误判概率的特征选择离散K-L变换法(DKLT)基于决策界的特征选择等方法。,7.2 类别可分性判据(Class Separability Measures),准则类别可分性判据:刻划特征对分类的贡献。构造的可分性判据Jij应满足下列要求:(1)与误分概率P(e)(或误分概率的上界、下界)有单调关系,Jij最大值时,P(e
2、)最小。(2)当特征相互独立时,判据有可加性,即,式中xk,是对象不同种类特征的测量值,Jij()表示使用括号中特征时第i类与第j类的可分性判据函数。,(3)判据具有“距离”的某些特性:Jij0,当ij 时 Jij=0,当i=j 时 Jij=Jji(4)Jij 对特征数目单调不减,即加入新的特征后,判据值不减 所构造的可分性判据并不一定要求同时具有上述四个性质。,7.2.1 基于几何距离的可分性判据,可以用距离或离差测度(散度)来构造类别可分性判据(一)点与点的距离在n维特征空间中,点 与 点之间的欧氏距离为(二)点到点集的距离点 到点集 之间的均方欧氏距离为,(三)类内及总体的均值矢量,设N
3、个模式分属c类,则各类的均值矢量分别为所有各类模式的总体均值矢量为式中Pi为相应类的先验概率。当用统计量代替先验概率时,有,(四)类内距离,类内均方欧氏距离为类内均方距离也可定义为(五)类内离差(散布)矩阵(Scatter)类内离差矩阵定义为类内离差矩阵SWi的迹等于类内的均方欧氏距离,即类内离差矩阵表示各类模式在类的均值矢量周围的散布情况。,(六)两类之间的距离,当式中的距离取欧氏距离时,有(七)各类模式之间的总的均方距离 当取欧氏距离时,(八)多类情况下总的类内、类间及总体离差(散布)矩阵,总的类内离差矩阵定义为总的类间离差矩阵定义为总体离差矩阵为 易导出,可分性判据(类内紧,类间开),可
4、以证明J1、J2与J4在任何非奇异线性变换下是不变的,J3与坐标系有关。,7.2.2 基于类的概率密度函数的可分性判据,用两类概密函数的重迭程度来度量可分性,构造基于类概密的可分性判据Jp,它应满足:(1)Jp 0;(2)当两类密度函数完全不重迭时,Jp=max;(3)当两类密度函数完全重合时,Jp=0;(4)相对两个概密具有“对称性”。,(a),(b),(一)Bhattacharyya判据(JB),在最小误分概率准则下,误分概率,(受相关定义与应用的启发,构造B-判据),(二)Chernoff判据(JC),性质:(1)对一切0s1,Jc0;(2)对一切0s1,;(3)当参数s和(1-s)互调
5、时,才有对称性,即,(比JB更广义的判据),(二)Chernoff判据(JC),性质:(4)当 各分量x1,x2,xn相互独立时,(5)当 各分量x1,x2,xn相互独立时,(6)最小误分概率,(JC不具有三点距离不等式的性质。),(三)散度JD(Divergence),对1类的平均可分性信息为 对2类的平均可分性信息为对于1和2两类总的平均可分性信息称为散度,其定义为两类平均可分性信息之和,即,类别可分性判据小结,几何可分性判据类概率密度可分性判据(一)Bhattacharyya判据(JB)(二)Chernoff判据(JC)(三)散度JD,第七章 特征提取与选择,7.7 特征选择中的直接挑选
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七章 特征提取与选择 第七 特征 提取 选择
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5679758.html