空间统计学分析分析课件.ppt
《空间统计学分析分析课件.ppt》由会员分享,可在线阅读,更多相关《空间统计学分析分析课件.ppt(124页珍藏版)》请在三一办公上搜索。
1、第六章 空间统计学分析,经典统计学研究纯随机变量变量可无限次重复观测或大量重复观测样本相互独立研究样本的数字特征,空间统计学研究区域化变量变量不能重复试验样本具有空间相关性研究样本的数字特征和区域化变量的空间分布特征,经典统计学与空间统计学的区别,空间统计分析方法由来由于空间现象之间存在不同方向、不同距离成分等相互作用,使得传统的数理统计方法无法很好地解决空间样本点的选取、空间估值和两组以上空间数据的关系等问题,因此,空间统计分析方法应运而生。空间统计分析方法组成空间统计分析方法由分析空间变异与结构的半变异函数和用以空间局部估计的克里格插值法两个主要部分组成,是GIS空间分析的一个重要技术手段
2、。,利用空间统计学进行矿产资源储量计算及平均品位估计利用空间统计学进行矿产资源预测及找矿勘探利用空间统计学进行石油勘探开发,1、在地质学中的应用,在土壤物理性质空间变异中的应用。 集中在应用空间统计学方法研究土壤颜色、土粒、土壤水分、土壤水力导度、饱和水压、孔径等土壤物理性质的空间变异。在土壤化学性质空间变异中的应用。 针对氮、磷、钾、钙、镁、土壤pH等土壤养分的空间相关性研究。对土壤化学性状的空间属性进行了描述和归类,同时为土壤养分管理、土壤环境背景值制图等提供了必要数据和方法。,2、在土壤学中的应用,2、在土壤学中的应用,在土壤学试验设计和采样方法中的应用 分析土壤特性的空间变异规律,可有
3、效指导土壤采样数目、样点分布、采样密度及采样方法的确定。在土壤质量管理方面的应用 空间统计学提供了利用已知取样点的数据去估测未采样点的土壤特性指标是否超过某一阈限的方法。近年来,空间统计学在土壤质量管理方面的应用主要集中在土壤养分管理和土壤污染研究。,3、在生态学中的应用,生态学变量空间变异性的定量描述和解释。 生物特征的估计。 生态学研究对象的时空变化规律分析,及不同相关研究对象的时空动态及耦合关系分析。,4、在环境学中的应用,土壤环境研究 空间统计学中的变异函数和克立格插值技术是进行重金属空间结构分析、模拟和估值的主要工具,通过描述和模拟污染物的空间分布特征以及估算未采样点的取值,揭示出污
4、染物在空间上的分布迁移趋势。水环境研究 用于地下水水位预测和污染物迁移扩散参数的估计、分析预测水环境污染物浓度、水质参数研究等。,5、在气象学中的应用,在数值天气预报和日常气象分析中,经常需要将不规则的站点资料插值到规则的网格。随着空间统计学方法的兴起,克立格法已经逐步应用于气象学领域。,第6章 空间统计学分析,6.3 空间局部估计,6.1 空间统计分析方法的基本原理,6.2 空间自相关,6.4 确定性插值法,6.5 探索性空间数据分析,一、空间统计分析的概念20世纪60年代,法国统计学家Matheron G通过大量理论研究,形成了一门新的统计学分支,即空间统计学。空间统计学是以区域化变量理论
5、为基础,以变异函数为主要工具,研究具有地理空间信息特性的事物或现象的空间相互作用及变化规律的学科。,6.1 空间统计分析方法的基本原理,自相关空间统计分析方法假设研究区中所有的值都是非独立的,相互之间存在相关性。在空间或时间范畴内,这种相关性被称为自相关。空间统计分析的重要任务揭示空间数据的相关规律和利用相关规律进行未知点预测。由于空间统计分析包含这两个显著的任务,所以涉及两次使用样点数据,第一次用作估计空间自相关,第二次用作未知点预测。,6.1 空间统计分析方法的基本原理,二、空间统计分析中的理论假设1、区域化变量 当一个变量呈空间分布时,称之为区域化。 区域化变量就是指以空间点x的三个直角
6、坐标(xu,xv,xw)为自变量的随机场Z (xu,xv,xw)= Z (x),它常常反应某种空间现象的特征。区域化变量的两重性表现在观测前把它看成是随机场,依赖于坐标(Xu,Xv,Xw),观测后是一个普通的空间三元函数值或一个空间点函数。,6.1 空间统计分析方法的基本原理,区域化变量是一种在空间上具有数值的实函数,它具有以下属性:,6.1 空间统计分析方法的基本原理,其它属性: 区域化变量在一定范围内呈一定程度的空间相关,当超出这一范围之后,相关性变弱甚至消失。 对于任一区域化变量,特殊的变异性可以叠加在一般的规律之上。,6.1 空间统计分析方法的基本原理,2、协方差函数在随机函数中,当只
7、有一个自变量x时称为随机过程,随机过程Z(t)在时间t1和t2处的随机变量Z(t1)、Z(t2)的二阶混合中心矩定义为随机过程的协方差函数记为CovZ(t1),Z(t2),即CovZ(t1),Z(t2)=EZ(t1)EZ(t1)Z(t2)EZ(t2) (6.1),6.1 空间统计分析方法的基本原理,当随机函数依赖于多个自变量时,Z(x)=Z(Xu,Xv,Xw)称为随机场,而随机场Z(x)在空间点x和x+h处的两个随机变量Z(x)和Z(x+h)的二阶混合中心矩定义为随机场Z(x)的自协方差函数,即CovZ(x),Z(x+h)=EZ(x)Z(x+h)EZ(x)EZ(x+h) (6.2)随机场Z(x
8、)的自协方差函数亦称为协方差函数,一般地,协方差函数依赖于空间点x和向量h。当h=0时,协方差函数变为Cov(x,x+0)=EZ(x)2EZ(x)2 (6.3),6.1 空间统计分析方法的基本原理,3、变异函数变异函数在一维条件下,当空间点x在一维x轴上变化时,区域变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差一半定义为区域变量Z(x)在x轴上的变异函数,记为(x,h),即(x,h)=1/2*VarZ(x)Z(x+h)2 =1/2*EZ(x)Z(x+h)21/2*EZ(x)EZ(x+h)2 (6.4),6.1 空间统计分析方法的基本原理,在二阶平稳假设条件下对任意h有 EZ(x
9、+h)=EZ(x)因此,式(6.4)可改写为 (x,h)=1/2*EZ(x)Z(x+h)2 (6.5)从式(6.5)可知,变异函数依赖于x和h,当变异函数仅依赖于h,与x无关时,变异函数(x,h)可改写成(h),即 (h)=1/2*EZ(x)Z(X+h)2 (6.6),6.1 空间统计分析方法的基本原理,4、平稳性假设及内蕴假设(1)平稳性假设设某一随机函数Z(x),其空间分布律不因平移而改变,即若对任一向量h,关系式 G(z1,z2,x1,x2,)=G(z1,z2,x1+h,x2+h,) 成立时,则该随机函数为平稳性随机函数。确切的说,无论位移向量h多大,两个k维向量的随机变量Z(x1),Z
10、(x2),Z(xk)和Z(x1+h),Z(x2+h),Z(xk+h)有相同的分布律。,6.1 空间统计分析方法的基本原理,当区域化变量满足下列两个条件时,称该区域化变量满足二阶平稳: 在整个研究区内,区域化变量Z(x)的数学期望对任意x存在且等于常数,即EZ(x)=m(常数),任意x。 在整个研究区内,区域化变量的空间协方差函数对任意x和h存在且平稳,即 CovZ(x),Z(x+h)=EZ(x)Z(x+h)-m2=C(h),任意x,h,6.1 空间统计分析方法的基本原理,(2)内蕴假设一些自然现象和随机函数具有无限离散性,这时区域化变量Z(x)的增量Z(x)-Z(x+h)满足下列两个条件时,就
11、称该区域化变量满足内蕴假设:在整个研究区内随机函数Z(x)的增量的数学期望为0,即 EZ(x)-Z(x+h)=0, 任意x,h对于所有矢量的增量的方差函数存在且平稳 VarZ(x)-Z(x+h)=EZ(x)-Z(x+h)2=2(x,h)=2(h),任意X,h即要求Z(x)的半变异函数存在且平稳。,6.1 空间统计分析方法的基本原理,内蕴假设可以理解为:随机函数Z(x)的增量Z(x)-Z(x+h)只依赖于分隔它们的向量h,而不依赖于具体位置x,这样,被向量h分割的每一对数据Z(x),Z(x+h)可以看成是一对随机变量Z(x1),Z(x2)的一个不同现实,而半变异函数(h)的估计量*(h)为 *
12、(h)=1/2N(h)*Z(xi)-Z(xi+h)2 式中,N(h)是被向量h相分隔的试验数据对的数目。,6.1 空间统计分析方法的基本原理,准平稳假设如果随机函数只在有限大小的邻域内是平稳的,则称该随机函数服从准平稳假设。准平稳(或准内蕴)假设是一种折中方案,它既考虑到某现象相似性的尺度,也顾及到有效数据的多少。,6.1 空间统计分析方法的基本原理,一、空间自相关理论在空间统计分析中,相关分析可以检测两种现象的变化是否存在相关性,若所分析的统计量为不同观察对象的同一属性变量,则称之为自相关。通过检测一个位置上的变异是否依赖于邻近位置的变异来判断该变异是否存在空间自相关性。根据变异的性质可以将
13、变异分为三种类型:绝对型变异(花的形态、颜色),等级型变异(植被密度等级)和连续型变异(形态测量、基因频率)。,6.2 空间自相关,空间自相关是针对同一个属性变量而言的,当某一测样点属性值高,而其相邻点同一属性值也高时,为空间正相关;反之,为空间负相关。当空间自相关仅与两点间距离有关时,称为各向同性;否则为各向异性。,6.2 空间自相关,二、空间自相关分析方法空间自相关方法按功能大致分为两类:全域型自相关、区域型自相关全域型自相关的功能在于描述某现象的整体分布情况,判断该现象在空间是否有聚集特性,但并不指出聚集在哪些区域。区域型自相关能够推算出聚集地的范围,原因在于: 1、由统计显著性检定的方
14、法,检定聚集空间单元相对于整体研究范围而言,其空间自相关是否足够显著,若显著性大,即是该现象聚集的地区。 2、度量空间单元对整个研究范围空间自相关的影响程度,影响程度大的往往是区域内的“特例”,“特例点”往往为聚集点。最为常用的计算空间自相关方法是:Morans I、Gearys C、Getis、Join count以及空间自相关系数图等,6.2 空间自相关,1、Morans I法建立空间区位相邻矩阵:若在区域内有n个空间单元,每个空间单元皆有一个观察值X,空间单元i与空间单元j的空间关系构成Wij的空间相邻矩阵,以1表示i和j相邻,以0表示i和j不相邻。其简单定义为 Wijnn 其中,Wij
15、为表示区位相邻矩阵,Wij=1表示区位相邻,Wij=0则表示区位不相邻。,6.2 空间自相关,Moran Index值是应用较广泛的一种空间自相关性判定指标,其计算式为式中, , 。Wij表示区位相邻矩阵;Cij表示属性相似矩阵;Xi和Xj分别为i和j空间单元属性数据值,Wij=1代表空间单元相邻,Wij=0代表不相邻,ij,Wii=0。,6.2 空间自相关,(6.16),若母体为随机分配,常采用统计验证的方式进一步判定Moran Index的期望值和变异数。I的期望值为其变异数为其中, ; ; ;,6.2 空间自相关,;Wi和Wi为相关权重矩阵i及j行的总和。,I值结果一定介于-1到1之间;
16、I0为正相关,数值越大表示空间分布的相关性越大,即空间上聚集分布的现象越明显;I0为负相关,数值越小代表示相关性小;I趋于0时,代表空间分布呈现随机分布的情形。,6.2 空间自相关,由于Morans I值的量测仅能表明属性相似的单元间是否呈聚集状态,无法由简洁的数值表达空间中的聚集分布状态,根据各空间间隔自相关值的计算,Morans I公式可改写为 其中,d代表空间间隔;Wij代表区位相邻矩阵。d=1代表空间单元是相邻的;d=2定义为与间隔一个的空间单元相接邻,而与原来的空间单元不相邻。,6.2 空间自相关,(6.19),区域空间自相关的定义为 其中,Ii为Local Moran Index,
17、Wij为区位相邻矩阵。即:n个区域空间自相关值累加和即全域空间自相关的值。,6.2 空间自相关,(6.20),2、Gearys Contiguity Ratio C法与Morans I类似,其表达式为 C = 1,表示不相关;0 1表示负相关。,6.2 空间自相关,(6.21),3、Getis统计法Anselin曾归纳各种空间聚集的研究方法,该方法经常表达为 其中,Wij代表i与j的空间关系,即类似上述空间相邻权重矩阵Wij;而yij则是i与j的观察式。 Yij的假设与观念不同,即为不同的空间聚集研究方法。,6.2 空间自相关,(6.22),全域型Getis 其中,wij(d)为距离d内的空间
18、相邻权重矩阵。 若i与j相邻,wij(d)=1;若i与j不相邻,wij(d)=0。区域型Getis 可量测每一个i在距离d的范围内,与每个j的相关程度。,6.2 空间自相关,(6.23),(6.24),4、空间自相关系数图分析法(以某地区为例)(1)图中有两处隆起处,代表微视尺度及宏观尺度上,存在显著的聚集分布现象,但聚集现象不存在于中观尺度上。(2)空间间隔为2时,空间自相关值有波峰,即在空间间隔为2时,其空间分布有最大的自相关性。,6.2 空间自相关,应用实例,中国大陆30个省级行政区人均GDP的空间关联分析。根据各省(直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵,选取各省(直辖
19、市、自治区)19982002年人均GDP的自然对数,依照公式计算全局Moran指数I,计算其检验的标准化统计量Z(I),结果如下表所示。,从表中可以看出,在19982002年期间,中国大陆30个省级行政区人均GDP的全局Moran指数均为正值;在正态分布假设之上,对Moran指数检验的结果也高度显著。这就是说,在19982002年期间,中国大陆30个省级行政区人均GDP存在着显著的、正的空间自相关,也就是说各省级行政区人均GDP水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚,其空间联系的特征是:较高人均GDP水平的省级行政区相对地趋于和较高人均GDP水平的省级行政区相邻,
20、或者较低人均GDP水平的省级行政区相对地趋于和较低人均GDP水平的省级行政区相邻。,选取2001年我国30个省级行政区人均GDP数据,计算局部Gi统计量和局部Gi统计量的检验值Z(Gi),并绘制统计地图如下。,检验结果表明,贵州、四川、云南西部3省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该4省市在空间上相连成片分布,而且从统计学意义上来说,与该区域相邻的省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的分布特征。,东部的江苏、上海、浙江三省市的Z值在0.05的显著性水平下显著
21、,天津的Z值在0.1的显著性水平下显著。而东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。,以(Wz,z)为坐标,进一步绘制Moran散点图 可以发现,多数省(直辖市、自治区)位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,而且位于第3象限内的低低集聚类型的省(直辖市、自治区)比位于第1象限内的高高集聚类型的省(直辖市、自治区)更多一些。,上图进一步显示了30个省级行政区人均GDP局部集聚的空间结构。可以看出,从人均GDP水平相对地来看: 高值被高值包围的高高集聚省(直辖市)有:北京、天津、河南、安徽、湖北、江
22、西、海南、广东、福建、浙江、山东、上海、江苏; 低值被低值包围的低低集聚省(自治区)有:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州; 被低值包围的高值省(直辖市)有:重庆、广西、河北;被高值包围的低值省份只有湖南。,空间局部估计空间局部估计也称空间局部插值,它是利用在地表不同位置采集的样点生成一个连续表面。常见的克立格插值模型有:普通克立格、简单克立格、泛克立格、概率克立格、指示克立格、析取克立格及协同克立格等插值一般分为两步:(1)样点空间结构量化分析半变异函数分析;(2)对未知点进行预测,6.3 空间局部估计,20世纪50年代,南非采矿工程师Danie
23、l Krige总结多年金矿勘探经验,提出根据样品点的空间位置和样品点之间空间相关程度的不同,对每个样品观测值赋予一定的权重,进行移动加权平均,估计被样品点包围的未知点矿产储量,形成了克里金估计方法(kriging)的雏形。 20世纪60年代初期,法国地质数学家Georges Matheron提出数学形式的区域化变量,严格地给出了基本变异函数(variogram)的定义和一般克里金估计方法。,一、半变异函数分析1、半变异函数及其性质半变异函数是一个关于数据点的半变异值与数据点间距离的函数,设区域化变量Z(xi)和Z(xi+h)分别是Z(x)在空间位置xi和xi+h上的观测值(i=1,2,N(h)
24、,则半变异函数可由下式进行估计 其中,N(h)是分隔距离为h的样本量。前提: Z(xi)为区域化变量且满足平稳条件和本征假设,6.3 空间局部估计,(6.25),空间统计学将变异函数理论模型分为3大类: 第1类是有基台值模型,包括球状模型、指数模型、高斯模型、线性有基台值模型和纯块金效应模型; 第2类是无基台值模型,包括幂函数模型、线性无基台值模型、抛物线模型; 第3类是孔穴效应模型。 下面有代表性地介绍几种常见的变异函数理论模型。,6.3 空间局部估计,纯块金效应模型:其一般公式为 式中:c00,为先验方差。该模型相当于区域化变量为随机分布,样本点间的协方差函数对于所有距离h均等于0,变量的
25、空间相关不存在。,球状模型:其一般公式为 式中:c0为块金(效应)常数;c为拱高;c0+c为基台值;a为变程。当c0=0,c=1时,称为标准球状模型。球状模型是地统计分析中应用最广泛的理论模型,许多区域化变量的理论模型都可以用该模型去拟合。,指数模型:其一般公式为 式中:c0和c意义与前相同,但a不是变程。当h=3时, ,即 ,从而指数模型的变程 约为 。当c0=0,c=1时,称为标准指数模型。,高斯模型:其一般公式为 式中:c0和c意义与前相同,a也不是变程。当 时, ,即 ,因此高斯模型的变程 约为 。当 时,称为标准高斯函数模型。,幂函数模型:其一般公式为 式中:为幂指数。当变化时,这种
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 统计学 分析 课件
链接地址:https://www.31ppt.com/p-1473446.html