空间相关性与分类比例在不同抽样设计中对准确性测量的影响——翻译.docx
《空间相关性与分类比例在不同抽样设计中对准确性测量的影响——翻译.docx》由会员分享,可在线阅读,更多相关《空间相关性与分类比例在不同抽样设计中对准确性测量的影响——翻译.docx(41页珍藏版)》请在三一办公上搜索。
1、空间相关性与分类比例在不同抽样设计中对准确性测量的影响DongMei Chen_, Hui Wei加拿大,金士顿ON K7L 3N6,皇后大学,地理系摘要:本文仿真了四幅结合两种空间相关性标准、两种不同的分类比例的二进制的专题图以研究借助不同抽样设计的分类准确性效果。11种抽样类型(从25到1296)按3种常用的抽样设计,包括简单随机抽样(SRS),系统抽样(SYS),分层随机抽样(StrRS)在4幅仿真地图上被仿真。常见的误差矩阵和相关的准确性度量也被考虑进每一个仿真中。同时,3种抽样设计的不同精度估计也相互比较。某一特别的抽样方法和抽样类型的选择依赖于空间相关性的程度、分类比例的差异以及应
2、用中所需的精度要求。通常,一幅地图分类比例的差异比空间相关性对抽样方法的效果影响更大。对于估计个体类的精度,特别在小型类中StrRS的效果比SRS和SYS的效果更好。对于估计总精确度,不同的抽样设计的效果相似。为了得到更好的KAPPA系数,推荐StrRS用于高类别比例差异的地图,推荐SRS用于低空间相关性和低类别比例差异的地图。关键词:精度评估;分类误差;抽样;分类比例1.引言随着遥感技术的发展,从遥感数据得到的专题地图被广泛应用于不同的环境建模,监控,以及计划中。但这些专题地图通常不能完美的代表现实,还常常包含误差和不确定性(Foody,2002)。在设计中使用这样的地图却不知道其中的误差和
3、不确定性会导致严重的风险。因此,在最近10年,对专题地图的准确性评估的需要不断增长(Congalton and Green, 1999;Congalton and Plourde,2002;Congalton,2002; Foody,2002;Lunetta and Lyon,2004;Stehman and Czaplewski,1998)。基于遥感的专题图的精确度涉及到一幅地图或分类的正确性(Foody,2002),或者涉及导出信息与参照数据(或地面实况)相吻合的程度(Campbell 1996)。常用的估计遥感专题图准确度的方法是比较参照数据和专题图。由于时间,花费上的限制,以及物理访问
4、的权限,想要获得地图上所有像素上的参考信息是不实际的,因此常常需要抽样参考数据。一旦搜集到参考数据以后,它们会和地图中此类数据对比,从定量精度指数产生误差矩阵,例如总体准确度、用户准确度、生产准确度等,另外也能计算出总体和个体的KAPPA系数(Congalton,1991;Congalton 和 Green,1999)。抽样方法和抽样量(或抽样大小)是两个决定精度评估的效率和花费的最重要的因素(Jensen,1996)。现在已经有很多发表的方程和指导方针以确定合适样本量的选择(Cochran,1977; Jensen,1996)。其中,二项分布和二项分布的正态常数经常用于计算所需的抽样大小(C
5、ongalton,1991)。然而,这些方程是基于正确的分类抽样的比例和某些允许的错误,可能并不合适产生一个误差矩阵(Congalton,2004)。当前的文献不能提供一个一致所需最小样本量的方法。Genderen et al(1978)表示,为了接受派生专题图95%的置信区间,至少需要30大小的样本量。Ginevan(1979) 和 Hay (1979)按更加保守的方法,得出最小样本量应为50,以避免拒绝一个精确的地图。Congalton(2004)根据经验推荐每个类的误差矩阵最少使用50的样本量。然而,在研究大型区域或一幅地图存在大量类别时最小样本量应该增加到75-100(Congalto
6、n,,2004)。不同的抽样方法被用来选择抽样单位以进行地图精度评估。常用的方法包括简单随机抽样、分层随机抽样、系统抽样、系统随机抽样、系统不对齐抽样和集群抽样(Cochran,1977;Congalton,1977;Stehman,1992)。Congalton(1988b)在三幅不同的土地覆盖地图上比较了五个抽样方案(简单随机抽样、分层随机抽样、系统抽样、系统随机抽样、系统不对齐抽样)不同的空间复杂性。他的结果表明,根据地图的空间复杂性,简单随机抽样在样本容量足够大时总能提供足够的估计,而系统抽样和分层系统不对齐抽样会高估分类误差及其方差。Stehman(1992)指出,Congalton
7、对系统抽样偏见的结论与Maling(1989)和Berry和Baker(1968)认为分层系统不对齐抽样是最公正的抽样设计的观点互相矛盾。基于使用两个精度措施(误分整体比例,kappa系数协议)的仿真研究,Stehman(1992)发现,除了具有周期模式的地图,系统抽样比简单随机抽样更为精确。然而,在专题地图的精度估计中比较了5中抽样方法的效果后,Lo和Watson(1998)得出的结论是,分层随机抽样最为适合混有简单和复杂空间模式的植被地图。上述研究中对立的结论突出了一幅的地图空间模式和复杂性对不同抽样方法效果的影响。.之前的研究表明,从遥感分类地图生成的图片往往是空间自相关的(Congal
8、ton,1988a;Hypannen,1996;Pugh和Congalton,2001)。空间自相关涉及相邻像素之间分类结果的相关性,并且与地图上周期性或空间模式有关。Congalton(1991)指出,现有专题地图上存在的空间相关性将推翻大多数取样方法中样本独立性的假设。若不考虑分类地图上空间自相关的影响,可能导致抽样设计对估计精度的偏差(Campbell,1996;Congalton,1988a,2001;Foody,2002;Pugh和Congalton,2001;Stehman,2004a)。几个研究人员对空间自相关抽样设计和分析精度评估中潜在的负面影响表示担忧(Congalton和G
9、reen,1999;Dicks和Lo,1990;Muller et al .,1998;Stehman,2000)。更高空间分辨率图像产生的地图导致空间自相关水平增大,导致空间自相关精度评估这个问题变得更加严重(Chen et al .,2004;Congalton,1988 b;Stehman,2000)。Congalton(1988 b)表示,系统和分层系统抽样的设计应避开这些具有高空间自相关性的地图。先前大多数关于最佳采样策略和适当样本量的结论都是基于总体精度(或误分类的总体比例)和/或kappa系数的实证检验。然而,人们却很少关注个体类的准确性。遥感图像生成的分类地图包括多个类,不同类
10、别的比例可能会有所不同。Rosenfield et al.(1982)和Congalton与Green (1999)推荐在抽样中应特别注意那些小型,却很重要的类。然而,很少有研究检查在不同的抽样方法中,涉及到个体类的准确性时,空间自相关和类别比例以及整体精度和/或kappa系数对结果的共同影响。本研究的目的是通过仿真实验检查空间自相关和类别比例是如何影响精度评估中抽样方法和样本量的选取。研究中控制图像的分类错误生成了若干仿真图像,让它们代表不同空间自相关程度和类别比例的分类地图。本文估计的抽样方法仅限于简单随机抽样(SRS)、系统抽样(SYS)和分层随机抽样(StrRS);按照个体类、总体精度
11、、kappa协议系数分析结果。2.方法论2.1.具有不同类别比例的空间自相关地图仿真仿真的第一步是生成具有不同空间自相关程度的参考地图。在ArcGIS中,结合创建随机栅格、焦点均值分析和重分类函数,生成两个代表高(H)和低(L)自相关程度的模型即可完成。首先,使用创建随机栅格函数生成一幅属性值从0到1的500 * 500随机栅格图像。500 * 500大小的选择兼顾了计算效率和实践中的图像尺寸。接着,应用具有不同邻域大小的焦点均值分析函数生成具有某些高或低自相关程度的随机图像。生成高自相关图像,应用3 * 3、9 * 9、16 * 16的窗口,而生成低自相关图像只用3*3、9*9的窗口。对每个
12、焦点进行分析后计算结果图像Morans I,检验新派生的图像是否达到所需的空间自相关程度。为了简化分析,从焦点分析得到的图像的值经阈值判断分为两类(Class 1和Class2)。这个阈值由每幅地图设计的分类比例决定的。例如,准备生成一幅90%像素属于Class 1,10%属于Class 2的二进制地图,如果地图上有90%像素的值小于0.7,那么阈值可设为0.7,这样小于0.7的值划分为Class 1,剩下的就划分为Class 2。这个简化的地图是地图上任何被抽样个体点的二进制代表。例如,如果一个森林类被抽样,那么,地图上的所有其他类可以被重新归类为非林地类。先前的研究已经表明在决定适当的抽样
13、方法和样本量时小型类是一个关注点(Congalton,1991;Congalton和Green,1991;Rosenfield et al .,1982)。因此,对应于每个空间自相关程度,各生成一高一低两幅类别比例差异图。在两幅类别比例差异高的地图上,大约90%的像素被分为大型类(Class 1),另外的10%分为小型类(Class 2)。两幅低类别差异图(H46和L46)的两类类别比例几乎相等(约60%的像素归为Class 1,40%的像素归为Class 2)。结合空间自相关程度和类别比例,仿真生成了四幅500 * 500专题地图(H91、L91 H46和L46),如图1所示,表1列出了详细
14、的配置。这四幅地图表示了四种类别比例(10%,10%,40%,和90%)和两种空间自相关程度(Morans I 0.80)的8种示例。四幅仿真图的Morans I相关图如图2所示。图1.仿真空间自相关性的参考图:(a) 高空间相关性和高类别比例差异(H91);(b) 高空间相关性和低类别比例差异(H46);(c) 低空间相关性和高类别比例差异(L91);(d) 低空间相关性和低类别比例差异(L46)。黑色为Class 1,白色为Class 2。表1 仿真参考图的参数仿真地图空间相关性(Morans I)Class 1Class 2H910.880.900.10H460.900.590.41L9
15、10.180.900.10L460.060.580.42仿真图像被用来代替真实图像的原因是,很难获得一系列具有可控空间自相关程度和类别比例的分类参考图像。在实际图像中,因为很难控制空间自相关程度和错误的百分比,会使系统分析变得困难。通过仿真的图像,我们可以控制空间自相关的程度并且在所有图像上产生恒定的错误。通过这种方式,任何在输出中的差异就只由可控制因素的变化而决定。2.2.分类误差的注入先前的研究指出,由分类所产生的误差并非随机分布在专题地图(Bian和Butler,1999;Congalton,1988 b)。通常会存在一个由传感器的属性所造成,对应于专题错误之空间分布的清晰模式 (Foo
16、dy,2002;Plourde和Congalton,2003),和/或在分类边界有空间性关联且存在误差的地面条件(Congalton,1988 b,Edwards和Lowell,1996;鲍威尔et al .,2004;Steele et al .,1998)。大多数发生在边界的错误与标准数据集和混合像素的误差配准有关。鉴于上述考虑,本研究中使用的仿真地图使用频率分布模型仿真注入在分类边界附近区域的误差。每幅地图中大约注入了误差的20%作为分类误差,这个误差比例往往存在于监督和非监督分类中。不同地图中注入的误差模式如图3所示。注入误差的地图被视为分类地图;没有注入误差的原始地图被视为参考地图。
17、表2详细展示了每一幅分类地图的分类错误和准确性措施,Class12表示Class1的误差注入Class2,Class21表示Class2的误差注入Class1,正确分类的Class1和Class2分别表示为Class11和Class22。图2.四幅仿真参考图的相关图(X-轴:滞后距离,单位像素;Y-轴:按Morans I测算的空间自相关程度)。(H46:高空间相关性和低类别比例差异;H91:高空间相关性和高类别比例差异;L46:低空间相关性和低类别比例差异;L91:低空间相关性和高类别比例差异)。表2 注入误差的仿真地图的参数仿真地图Class 11的比例Class 22的比例Class 12
18、的比例Class 21的比例总体精度Kappa系数H910.720.080.180.020.800.35H460.470.320.120.080.790.58L910.720.080.180.020.800.35H960.460.330.130.080.790.57(Class11:正确分类的Class1;Class22:正确分类的Class2;Class12:Class1的误差注入Class2;Class21:Class2的误差注入Class1;H46:高空间相关性和低分类比例差异;H91:高空间相关性和高分类比例差异;L46:低空间相关性和低分类比例差异;L91:低空间相关性和高分类比例差
19、异)图3.不同地图中注入的分类误差(白色显示)模式:(a)高空间相关性和高分类比例差异(H91);(b)高空间相关性和低分类比例差异(H46);(c)低空间相关性和高分类比例差异(L91);(d)低空间相关性和低分类比例差异(L46)。2.3.抽样分类地图和参考地图仿真后,在ArcGIS环境中实现三种抽样方法(简单随机抽样(SRS)、系统抽样(SYS)和分层随机抽样(StrRS)的抽样。遥感图像通常以单个像素为单位进行抽样。每个地图使用11个不同的样本大小(从25到1296),按3种抽样方式各仿真抽样100次。换句话说,需要仿真实验重复100次以检查稳定性措施的精度。仿真次数的选择要兼顾统计的
20、稳定性和计算成本。从统计学的观点来看,30次仿真应足以提供统计置信需要(Bian和Butler,1999;Openshaw和Alvanides,1999)。应该注意,这里使用的最大样本量只是像素总数的0.52%左右,这远远小于Congalton(1988 b)和Stehman(2000) 的研究中最大人口抽样比例。简单随机抽样(SRS)不放回、独立、随机地选取每个像素(Congalton,1988 b),每个像素被选取的概率相同。在系统抽样(SYS)中,只有第一个抽样像素是随机选择的,其他所有采样像素选择以固定间隔从最初的像素中选取(Congalton,1988 b)。SYS抽样使用的间隔由样
21、本大小决定,并使样本在空间上均匀分布。在分层随机抽样(StrRS)中,每个分类地图再被分为两层:Class 1和Class 2,然后每层内随机选择抽样像素。StrRS中每个类的总样本量大小与该类在地图上的大小成正比(Fitzpatrick-Lins,1981)。本文使用的分层抽样不同于Congalton(1988 b)使用的,这里进行了几何分层而不是类范畴的分层。按地图类的分层是一种常见的实现精度评估的分层方式,可以提高用户准确性估计的精度(Stehman,2004 b)。对于每一次抽样,都对比其在分类图和参考图中采样像素的类别值,并生成传统的误差矩阵。然后对每次抽样中Class 11、Cla
22、ss 22、Class 12和Class 21的比例求和。每次仿真都生成包括整体精度和kappa系数在内的准确性检验参数。同时还要计算这些估计量的均值和方差。2.4.抽样方法的比较对比变异系数(CV)和每个估计量的离差。变异系数是标准差与均值的比,因为它还考虑了均值,通常被称为相对标准差(Burt和Barber,1996)。估计量由为每种采样方法和样本量进行的100次仿真的真值得到。使用变异系数代替Congalton(1988 b)研究中使用的均值和方差是为了确保直接比较不同的精度措施。对于每个样本大小和不同的抽样方法,变异系数测出了一幅仿真图像中一系列估计精度与预期均值(即每个测量的真值)的
23、接近程度。如果从仿真估计的标准差是均值的一半,则其CV值为0.5(或50%)。抽样法的CV越低,从每幅仿真图中获得的精度的变异性就越小,因此其精度也越高。为了比较不同的抽样方法,Stehman(2000)使用“设计效果”计算评估了SYS的精度和StrRS相对于SRS的精度。对于每个样本的大小,设计效果的是方差与SYS的比值或StrRS与SRS方差的比值。在这项研究中,准确性测量的方差估计使用以下公式:这里P是一个测量精度的真值,Pi是仿真量i的估计值。SYS和StrRS的设计效果是为了计算Class 11、Class 22、kappa系数和整体精度所占的比例。设计效果乘以100是为了达到采样方
24、法所需的观测数量,以提供与SRS抽样100个观察对象相同精度的样本大小。如果某抽样设计的设计效果小于1,那么这个设计就比随机抽样抽样具有更好的精度。3.结果与讨论3.1.变异系数(CV)的分析图4-6中显示了正确分类的Class 1(Class 11),Class 2(22)的变异系数,总体精度,SRS,SYS,StrRS的kappa系数。和预期结果一样,除了系统抽样中的一些异常,对于所有抽样方法和精度的措施,CV值都随样本量的增加而减少。对于所有三种抽样方法,尽管这些差异随着样本量的增加而减少,但四种精度评价中CV值的差异在高分类比例地图(H91和L91)中要比低分类比例地图(H46和L46
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 相关性 分类 比例 不同 抽样 设计 准确性 测量 影响 翻译
链接地址:https://www.31ppt.com/p-1689864.html