高光谱遥感数据的特征选择与提取.ppt
《高光谱遥感数据的特征选择与提取.ppt》由会员分享,可在线阅读,更多相关《高光谱遥感数据的特征选择与提取.ppt(80页珍藏版)》请在三一办公上搜索。
1、1,第五章 高光谱遥感数据的特征选择与提取,本章主要介绍高光谱遥感数据的可分性标准,光谱特征选择,光谱自相关性分析,特征提取以及投影变换等内容。,2,高光谱遥感数据有助于我们完成更加细致的遥感地物分类和目标识别,然而波段的增多也必然导致信息的冗余和数据处理复杂性的增加。具体表现在:(1)数据量急剧增加:波段的增加,使得高光谱数据比传统数据多1-2个数量级,表现在显示,存储,管理方面相当繁琐(2)计算量增大:数据的膨胀导致计算机处理载荷大幅度增加,寻找有效地降维空间手段是必要的(3)统计参数的估计误差增大:利用统计方法为了达到比较精确的估计,样本个数一般是波段数的100倍以上,这在高光谱数据中往
2、往无法实现,因此,导致了分类精度的普遍下降。,3,当光谱维数增加的时候,特征组合形式成指数倍增加,例如原始波段为N,优选后的光谱波段是M,那么光谱特征组合数为:N!/(N-M)!/M!。显然这个数目很巨大,直接导致了运算效率下降,因此,如何优化光谱特征空间,进行光谱选择非常重要。,问题提出?,4,该图列出了波段数增加时,不同的样本个数与类别可分性的变化,5,为了进行最优选择,我们需要一个准则来衡量。如果特征可以进行分类,那么我们利用分类的错误概率来作为特征选择的准则。前人的研究表明:可分性越高的特征,分类错误的概率越低,选择的特征越优。最优特征分类错误概率可分性,5.1 最优特征的选择可分性,
3、6,可分性准则,选择可分性准则必须综合考虑两个策略:一、选择各类平均可分性最大的特征二、选择最难分的类别具有的可分性最大的特征第一个策略能均衡照顾到各类的可分性;第二个策略能照顾到最难分的类别。,7,设计光谱可分性的准则必须满足三个方面的要求(黄凤岗等,1998):(1)与错误概率具有单调关系。这样准则取最大值的情况下,所得到的错误概率应该是最小的。(2)度量特性。设定两类地物类别i,j的度量特性为,越大,两类特征的分离程度越大。(3)单调性。新加入的特征,准则函数的值并不减小。,光谱可分性准则,8,满足这个策略的可分性准则有很多,归纳起来可以分为以下四种准则:(1)各样本之间的平均距离;(2
4、)类别间的相对距离;(3)离散度;(4)J-M距离;,可分性准则所描述的指标,9,(1)各类样本间的平均距离,各类样本之间的距离越大,类别可分性越大,因此可以利用各类样本之间的距离的平均值作为可分性的准则。例如:常用的距离函数有欧氏距离,马氏距离,明氏距离等。但是,很多情况下,类别之间的平均距离并不一定代表了类别之间的可分性。如下图所示,10,两种分布的可分性比较,类别间的距离平均值不能完全反映类别的可分性,11,(2)类别间的归一化距离,根据费歇尔准则,分类时总是希望类内的离散度尽量小,类间的离散度尽量大,那么根据这个定律,可以作为相对距离的一个度量,度量的公式为归一化距离:,12,13,当
5、我们用这个距离公式衡量类别的可分性的时候,存在这样的情况,无法衡量两类的差别:,14,(3)离散度,离散度可以克服当两个类别均值相等时,不能有效区分类别的局限,离散度表达式为:当类别多于两个时,可以用平均离散度来衡量类别可分性。,15,尽管离散度克服了类均值相等给归一化距离带来的麻烦,但是并非最优的类别可分性度量,当样本的分布存在的情况如下图所示的时候,离散度并不能有效的反映可分性(b的可分性显然要高于a),16,(4)J-M 距离(Jeffries-Matusita),J-M距离基于条件概率理论,其表达式可以近似为:P代表第i个像元属于w的条件概率。,17,总结,1)可分性准则中J-M距离的
6、可分性效果是最好的,J-M距离实际上就是两类概率密度函数之差,基于先验概率和样本分布。2)离散度的可分性效果总体不如J-M距离,但是当各类模式分布相对集中,模式距离没有超出临界值时,也比较有效。3)归一化距离的衡量有效性又次之。加入样本均值十分接近,或者过于分散,会丧失有效性。4)各样本距离的平均值用来衡量可分性,效果最差。只有当样本的各个分布一致,且既不太离散也不太集中的特殊情况下,才有效。,18,5.2 光谱特征选择,19,通过特征选择,可以强化最具可分性的光谱波段,这里分为:光谱特征位置搜索和光谱距离统计。光谱特征位置搜索:根据专家对特定地物的物理化学性质和光谱特性分析,选择最具有排他性
7、的光谱特征波段。光谱距离统计:在光谱可分性距离的统计准则下,选择光谱波段子集,使得在某一个光谱可分性距离统计准则下,其统计差异最大或者最优。,20,1.光谱特征位置搜索,特征位置通常是要确定特征吸收波段的位置分为以下三个部分:1)包络线去除(包络线归一化)包络线从外观上面来看,相当于光谱曲线的“外壳”,我们用连续的这种折线段来近似表示光谱曲线的包络线。,21,手工搜索:利用定义手工逐点直线连接突出的“峰”值点,并使得折线在“峰”值点的外角180度,然后用实际光谱波段值去除相应的波段值,这样归一化后,峰值点均为1,非“峰”值点均小于1。这样就很容易测定吸收特征参数。,22,计算机搜索:,23,由
8、包络线去除法调整的明矾石光谱曲线,24,包络线去除前后的光谱反射率曲线对比,25,举例说明:经过包络线去除后,可以有效的区分高岭石与白云石的有效区间,这里挑选5个特征波段:B1(2.16)B2(2.18)B3(2.21)B4(2.32)B5(2.38),2)选择特征波段区分地物,26,以上的五个特征可以构成一个凸面几何空间,高岭石与白云石在这个投影变换后的特征空间集中在两个彼此分离的区间,两者能够完全区分,27,3)基于特征位置进行彩色合成,高光谱影像具有上百个通道,但是彩色合成只有三个通道,因此选择RGB的合成方案非常重要。利用特征位置,可以缩小候选区域,突出感兴趣像元光谱的提取以及感兴趣区
9、域的划分。,28,下图是一种地物的光谱曲线,在1.4微米附近有一个特征吸收峰,如果在此特征吸收波段赋值为绿色,在两边的非吸收通道赋值为红色和蓝色,那么在RGB合成图像里面,紫红色的像元就应该是具有该吸收特征的地物。这样可以为我们进行ROI的选择提供帮助。,29,高光谱遥感图像波段众多,如何在可分性的基础上,从n个特征中选择m个最优子集?介绍两种算法:(1)单独选择法(按照平均可分性)根据可分性准则函数计算n个特征中每个特征可分性,然后根据各个特征的可分性大小进行排序,选择可分性最大的前m(nm)个特征。,2.光谱距离统计,30,(2)扩充最优特征子集(平均可分性)一、计算每个特征对应的所有类别
10、的可分性,选择可分性最大的进入到最优子集当中;二、增加一个特征构成新的特征集,重新计算特征集合的可分性,选择最大的特征组合作为新的最优子集。三、重复执行第二步,直到最优的特征子集达到m个为止。,31,必须指出的是以上的算法均假设各个特征之间相互独立,没有考虑特征之间的相关性。实际上,各个特征之间是存在相关性的,首先应该剔除一些可分性小,与其他特征相关性大的特征,选择最优,可分性最大的特征组。,注意:,32,光谱距离统计,33,光谱相关性是指图像同一空间位置的像素在各波段有相似性。原因:光谱图像的每个波段图像的像素值,是相同区域地物对各个波段光的反射强度值,相邻波地物反射率是相近的,由此产生了一
11、定的相关性。光谱相关性的大小很大程度上是由光谱分辨率决定的,光谱分辨率越高,统计相关性也越高。,5.3 光谱自相关性分析,34,光谱相关性波段选择,光谱波段选择一般遵循以下3个原则:一、所选择的波段信息总量要大二、所选的波段相关性弱三、目标地物类型要在所选的波段组合内与其他地物有很好的可分性。,35,选择最优波段的方法,(1)方差法。最简单的挑选方式,每一个波段中单个像元的亮度值与平均亮度值差的平方和,再取平均数。单波段的方差越大,表明波段的离散程度越大,信息量越丰富。,36,各波段的方差(标准差)反映了图像各像元灰度值与平均值总的离散度,一定程度上反映了各波段信息量,其值越大,所包含的信息量
12、越大,地物之间越容易区分。下面以一幅128个波段的omis影像为例,介绍图像方差(标准差)所反应出来的图像信息量大小。,37,(a)第10 波段的图像,(b)第65波段的图像,(C)第126 波段的图像,38,图像在128个波段的标准差。可以看出,波段65-96这些波段的标准差较小(几乎都小于50),所以这些波段子集包含的信息量就少。而波段27-30,35-39,113-114,116-118的标准差较大(基本都大于400),这些波段包含的信息量就较多。高光谱遥感图像各波段的信息量分布并没有规律,在一个很小的波长范围内,各波段的信息量分布不均匀。就是相邻两个波段的信息量有时差别也很大。,39,
13、(2)相关系数法,通过相关系数r(-11之间)来比较两个光谱图像之间的相关性,它反映了不同变量之间的相关程度,R越大,说明波段问信息重叠越大。它的大小取决于两个变量之间的协方差和它们各自的标准差,其计算公式为:这里定义j=i+1,即:比较相邻两个波段之间的相关性,可以用下面的表来显示,40,相邻波段之间相关系数表,41,用图像的直方图形式来统计相关性,42,43,44,相关系数也可以用来比较其他的参量,45,原理:由前面两种评判的原则组成。即:图像数据的标准差越大所包含的信息量也越大,波段间的相关系数越小,表明各波段图像数据的独立性越高,信息的冗余度越小。计算公式如下:S代表标准差,R代表相关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 光谱 遥感 数据 特征 选择 提取
链接地址:https://www.31ppt.com/p-6215870.html