[ppt模板]空间数据的分析.ppt
《[ppt模板]空间数据的分析.ppt》由会员分享,可在线阅读,更多相关《[ppt模板]空间数据的分析.ppt(235页珍藏版)》请在三一办公上搜索。
1、1,如何为一公园选择合理位置?,空间数据分析,2,What is“Spatial Analysis”?,3,An Early Example:,1854年8月到9月英国伦敦霍乱流行时,当局始终找不到发病的原因,后来医生约翰斯诺(John Snow)参与调查。,4,他在绘有霍乱流行地区所有道路、房屋、饮用水机井等内容的1:6500比例尺地图上,标出了每个霍乱病死者的居住位置,得到了霍乱病死者居住分布图。,5,霍乱病死者居住分布图(John Snow,1854),6,霍乱死亡病例与水源的关系,7,斯诺博士分析了这张分布图,马上想到霍乱病源之所在死者住家都集中于饮用“布洛多斯托”井水的地方及周围。,
2、8,在这个例子中,患者的居住地与饮用水井之间的空间位置关系提示了霍乱病的发病根源。,9,定 义,空间分析是基于空间数据的分析技术,它以地学原理为依托,通过分析算法,从空间数据中获取有关地理对象的空间位置、空间分布、空间形态、空间形成、空间演变等信息。根本目的在于:通过对空间数据的深加工和分析获取新的信息。,10,空间分析的主要内容,11,1、空间位置:借助于空间坐标系传递空间对象的定位信息,是空间对象表述的研究基础,即投影与转换理论。2、空间分布:同类空间对象的群体定位信息,包括分布、趋势、对比等内容。3、空间形态:空间对象的几何形态。4、空间距离:空间物体的接近程度。5、空间关系:空间对象的
3、相关关系,包括拓扑、方位、相似、相关等。,各种空间分析方法,12,基本的空间分析包括以下方面:空间索引 7.1 空间查询 7.1 空间量算 7.2空间统计分析 7.3缓冲区分析7.4叠加分析 7.5数字高程模型7.6网络分析7.7 空间建模与空间决策支持系统 7.8空间分析与空间动态建模 7.10,面向应用的分析,简单的空间分析,复杂的空间分析,7.1 空间索引,空间索引就是根据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。,13,索引类型主要有:一、格网型空间索引二、BSP树空间索引
4、三、KDB树空间索引四、R树和R+树五、CELL树,14,一、格网型空间索引,将研究区域用横竖线条划分大小相等和不等的格网,记录每个格网所包含的空间实体。当用户进行查询时,首先计算出用户查询对象所在格网,然后再在该格网中快速查询所选空间实体。,15,7.1 空间信息查询,16,空间数据的查询就是依靠数据库所储存的空间与属性信息来回答现实世界中一些应用问题。该查询工作可分为两步:首先,借助于空间索引,在空间数据库中快 速检索出被选空间实体;然后,根据空间数据和属性数据的连接即可 得到该空间实体的属性列表。,基于属性特征查询 一般来说,基于属性信息的查询操作主要是在属性数据库中完成的。基于空间关系
5、和属性特征的查询(SQL)一种空间扩展SQL查询语言GeoSQL,17,18,GeoSQL的实现过程,19,查询过程分为三种类型:根据数据库中的数据及信息,直接回答人们的问题;通过逻辑表达式完成查询;根据现有数据模型,构造复杂模型,回答更为“复杂”的问题。,20,应用举例:为一家新开设的银行选址。要求:1、远离目前存在的银行;2、附近有大量的人口数量;3、结果以矢量数据的文件形式输出。,21,人口密度专题图(popden),银行位置专题图(bank.shp),街区专题图(street.shp),22,1、查询提取私人储蓄额高于10000000的银行。,2、计算生成距离远近分布图。,23,3、根
6、据距离和人中密度专题图层,查询提取远离已有银行500且人口密度大于3000的区域。,4、将提取的栅格图层转为矢量图层,并与街区专题图进行叠加显示。,24,定位查询分层查询区域查询条件查询空间关系查询,最基本的查询功能,可查询图形与属性数据,一、查询内容,25,查询分层存放的图形与属性数据,定位查询分层查询区域查询条件查询空间关系查询,26,定位查询分层查询区域查询条件查询空间关系查询,查询区域内的图形与属性数据,27,定位查询分层查询区域查询条件查询空间关系查询,根据条件表达或查询图形与属性数据,28,定位查询分层查询区域查询条件查询空间关系查询,又称拓扑查询,面与面,线与线,点与点,点与线,
7、点与面,线与面,二、GIS查询系统具备的功能,(1)空间数据处理的功能。查询处理器针对一定的数据模型和实际应用问题,必须设计一些程序模块和过程,对空间数据进行基本运算。这些基本运算和操作,除了常规的算数、统计及逻辑运算外,还应具有空间搜索、再分类、叠加、邻域、连通等空间数据的分析操作。,29,(2)空间数据处理的控制功能。这种控制是对计算机指令进行具体的空间数据运算。空间查询处理器的这种控制规范是以一种高级语言的形式来表达,称为查询语言,过去表现为按一定的词法和句法进行人机交互,现在表现为过程、控件和菜单等形式。,30,(3)构造应用模型的能力。为了面向专业领域的应用,GIS 的查询处理器必须
8、提供一种开发语言和接口,使其具有使用和组合空间数据的基本操作,构造应用模型的能力。,31,7.2 空间量算,32,空间信息的自动化量算是地理信息系统所具有的重要功能,也是进行空间分析的定量化基础。,33,其中的主要量算有:一、几何量算 二、形状量算三、质心量算四、距离量算,一、几何量算,几何量算对点、线、面、体4类目标物而言,其含义不同的:点状目标:坐标;线状目标:长度、曲率、方向;面状目标:面积、周长等;体状目标:表面积、体积等。,34,1.线的长度计算,线长度可通过求算两点间直线距离得到。矢量数据结构中的求算:栅格数据结构中的求算:,35,2.面状地物的面积,36,矢量数据结构:面积和周长
9、的计算。在平面直角坐标系中,计算面积时,对于每条边,计算y值以下面积,求其代数和,便是多边形面积值,周长则是线段之和。,栅格数据结构:统计具有相同属性值的格网数目。,37,二、形状量算,地物外形是影像处理中模式识别的一个重要部分。目标物的外观是多变的,很难找到一个准确的量对其进行描述。,38,面状地物形状量测两个基本考虑:空间一致性问题:即有孔多边形和破碎多 边形的处理;多边形边界特征的描述问题。,39,度量空间一致性最常用的指标是欧拉函数,用来计算多边形的破碎程度和孔的数目。欧拉函数的结果是一个数,称为欧拉数。欧拉函数的计算公式为:欧拉数=(孔数)(碎片数1),40,41,关于多边形边界描述
10、问题,最常用的指标包括多边形长短轴之比,周长面积比,面积长度比。,42,43,其中,P为目标物周长,A为目标物面积。,r1,目标物为紧凑型;r1,目标物为标准型;r1,目标物为膨胀型。,44,45,三、质心量算,46,质心是描述地理对象分布的一个重要指标。质心通常定义为多边形的几何中心或重心。,47,48,在有些情况下,质心描述的是分布中心,而不是绝对几何中心。,如果考虑其他一些因素,对其赋予一定的权重系数,称为加权平均中心。式中,Wi第i个离散目标物权重;Xi,Yi第i个离散目标物的坐标。,49,四、距离量算,50,距离描述了两个事物或实体之间的远近程度。各向同性表面简单距离;欧式距离各向异
11、性表面耗费距离。非标准欧式距离,7.3 空间数据统计分析,51,52,常规统计分析主要完成对数据集合的均值、总和、方差、频度、峰度系数等的统计分析。其他的统计分析往往对空间数据及其相关信息进行抽象,采用更加复杂的数据模型进行分析,主要包括:回归分析 趋势分析 层次分析,主成分分析 聚类分析 判别分析,数据统计模型,从人类认识的角度来看有精确的和模糊的两种类型,因为绝大多数地理现象难以用精确的定量关系划分和表示,因此模糊的模型更为实用,结果也往往更接近实际,模糊评价一般经过四个过程:评价因子的选择与简化;多因子重要性指标(权重)的确定;因子内各类别对评价目标的隶属度确定;选用某种方法进行多因子综
12、合。,53,一、主成分分析二、层次分析法三、系统聚类分析四、判别分析五、趋势面分析六、最优分割分级法,54,一、主成分分析,55,56,地理系统是多要素的复杂系统。在地理学研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。,因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?,57,58,事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。主成分分析是把原来多个变量划为少数几个综合指标的
13、一种统计分析方法。从数学角度来看,这是一种降维处理技术。,例如:100个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)。,59,二、层次分析法(AHP),60,日常生活中有许多决策问题。决策是指在面临多种方案时需要依据一定的标准选择某一种方案。例1 购物 买饭,则要依据色、香、味、价格等方面的因素选择某种饭菜。例2 择业面临毕业,可能有高校、科研单位、企业等单位可以去选择,一般依据工作环境、工资待遇、发展前途、住房条件等因素择业。,61,层次分析法是美国运筹学家Saaty教授于二十世纪80年代提出的一种实用的多方案或多目标的决策方法。其主要特征是,它合理地将定性与定量的决策结合起
14、来,按照思维、心理的规律把决策过程层次化、数量化。该方法自1982年被介绍到我国以来,以其定性与定量相结合地处理各种决策因素的特点,以及其系统灵活简洁的优点,迅速地在我国社会经济各个领域内,如能源系统分析、城市规划、经济管理、科研评价等,得到了广泛的重视和应用。,62,层次分析法简介,一、层次分析法基本原理,63,分解,建立,确定,计算,判断,实际问题,层次结构,多个因素,诸因素的相 对重要性,权向量,综合决策,二 层次分析法的基本步骤,64,1 建立层次结构模型,2 构造成对比较矩阵,3 层次单排序及一致性检验,4 层次总排序及其一致性检验,65,尺度,第 个因素与第 个因素的影响相同,第
15、个因素比第 个因素的影响稍强,第 个因素比第 个因素的影响强,第 个因素比第 个因素的影响明强,第 个因素比第 个因素的影响绝对地强,含义,比较尺度:(19尺度的含义),2,4,6,8表示第个因素相对于第个因素的影响介于上述两个相邻等级之间。不难定义以上各尺度倒数的含义,根据。,66,三 层次分析法的优点和局限性,1 系统性 层次分析法把研究对象作为一个系统,按照分解、比较判断、综合的思维方式进行决策,成为系统分析的重要工具。,2 实用性 层次分析法把定性和定量方法结合起来,能处理许多用传统的最优化技术无法着手的实际问题,应用范围很广,同时,这种方法使得决策者与决策分析者能够相互沟通,决策者甚
16、至可以直接应用它,这就增加了决策的有效性。,67,3 简洁性 具有中等文化程度的人即可以了解层次分析法的基本原理并掌握该法的基本步骤,计算也非常简便,并且所得结果简单明确,容易被决策者了解和掌握。,该法的局限性主要表现在以下几个方面:,第一 只能从原有的方案中优选一个出来,没有办法得出更好的新方案。,68,第二 该法中的比较、判断以及结果的计算过程都是粗糙 的,不适用于精度较高的问题。第三 从建立层次结构模型到给出成对比较矩阵,人主观 因素对整个过程的影响很大,这就使得结果难以让 所有的决策者接受。当然采取专家群体判断的办法 是克服这个缺点的一种途径。,三、系统聚类分析,69,首先将n个样本各
17、自成一类,然后规定类与类之间的距离,选择距离最近的两类合并成一个新类,计算新类与其他类的距离,再将距离最小的两类进行合并。这样每次减少一类,直到达到所需的分类数或所有样本都归为一类为止。,70,一、聚类要素的数据处理,在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。,71,假设有m 个聚类的对象,每一个聚类对象都有n个要素构成。它们所对应
18、的要素数据可用表3.4.1给出。,72,表3.4.1 聚类对象与要素数据,二、直接聚类法,原理 先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。每经过m-1次就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。,73,图3.4.1 直接聚类谱系图,74,实例分析,下表给出了某农业生态经济系统各个区域单元的有关数据,下面我们运用系统聚类法,对该农业生态经济系统进行聚类分析,步骤如下:(1)采用欧氏距离测度21个区域单元之间的距离;(2)选用组平均法,计算类间的距离,依据不同的聚类标准(距离),对各样本(各区域单元)进行聚类,并作出聚类谱
19、系图。,75,76,某农业生态经济系统各区域单元的有关数据,77,78,某农业生态经济系统区域单元的系统聚类(组平均法)谱系图,从聚类分析谱系图(图3.4.5)可以看出,在不同的聚类标准(距离)下,聚类结果不同,当距离标准逐渐放大时,21个区域单元被依次聚类。当距离为0时,每个样本为单独的一类;当距离为5,则21个区域单元被聚为16类;当距离为10,则21个区域单元被聚为9类;当距离为15,则21个区域单元被聚为5类;当距离为20,则21个区域单元被聚为3类;最终,当聚类标准(距离)扩大到25时,21个区域单元被聚为1类。,79,四、判别分析,80,有一些昆虫的性别很难看出,只有通过解剖才能够
20、判别;但是雄性和雌性昆虫在若干体表度量上有些综合的差异。于是统计学家就根据已知雌雄的昆虫体表度量(这些用作度量的变量亦称为预测变量)得到一个标准,并利用这个标准来判别其他未知性别的昆虫。这样的判别虽然不能保证百分之百准确,但至少大部分判别都是对的,而且用不着杀死昆虫来进行判别了。,81,判别分析和前面的聚类分析主要不同点就是,在聚类分析中一般人们事先并不知道或一定要明确应该分成几类,完全根据数据来确定。而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。,82,五、趋势面分析,83,一、空间趋势面分析概述趋势
21、面分析 用数学的方法,以数学模型来模拟(或拟合)地理数据的空间分布及其区域性变化趋势的方法。,84,趋势面的性质与特点是一种光滑的数学曲面,它能集中地代表地理数据在大范围内的空间分布变化趋势与实际上的地理曲面不同,它只是实际曲面的一种近似值。实际曲面包括趋势面和剩余(或离差)曲面两部分,即实际曲面趋势面+剩余曲面,85,二、趋势面分析的数学模型,(一)趋势面分析的数学原理设以Zi(xi,yi)表示某一地理特征值在空间上的分布。其中(xi,yi)为平面上点的坐标。任一观测点Zi可分解为两个部分,即,86,趋势面参数的确定(最小二乘法)使每一个观测值与趋势值的残差平方和为最小,即,87,(二)多项
22、式趋势面的数学模型,88,89,多项式方程作为趋势面方程因为任何函数在一定范围内总可以用多项式来逼近,并可调整多项式的次数来满足趋势面分析的需要,一般来说,多项式的次数越高则趋势值越接近于观测值,而剩余值越小,90,7.4 缓冲区分析,91,邻近度(Proximity)描述了地理空间中两个地物距离相近的程度,其确定是空间分析的一个重要手段。缓冲区分析是解决临近度问题的空间分析工具之一。,92,所谓缓冲区就是地理空间目标的一种影响范围或服务范围。从数学的角度看,缓冲区分析的基本思想是给定一个空间对象或集合,确定它们的邻域,邻域的大小由邻域半径R决定。,93,94,对于一个空间实体Oi,其缓冲区定
23、义为:,对于空间实体集合:,其缓冲区定义为:,95,96,缓冲区类型:一、基于矢量结构的缓冲区分析二、基于栅格结构的缓冲区分析,1.矢量点的缓冲区:如建立污染源缓冲区,该区不能有饮用水源通过,97,98,2.矢量线的缓冲区:,线的窄缓冲区线的宽缓冲区,99,公路噪声污染,在公路两侧建立缓冲区,该区内不建立居民区;为防止水土流失,河流两侧建立缓冲区,该区内森林不许砍伐。,100,3.矢量面的缓冲区:,101,湖泊周围一定范围内为水源涵养林,限砍。,缓冲区计算的基本问题是双线问题。双线问题有很多另外的名称,如图形加粗,加宽线,中心线扩张等,它们指的都是相同的操作,102,103,角分线法(简单平行
24、线法),角分线法的缺点是难以最大限度保证双线的等宽性,尤其是在凸侧角点在进一步变锐时,将远离轴线顶点。,104,凸角圆弧法,105,对于简单情形,缓冲区是一个简单多边形,但当计算形状比较复杂的对象或多个对象集合的缓冲区时,就会产生若干个自相交多边形。,106,107,自相交多边形分为两种情况:岛屿多边形和重叠多边形。,108,算法比较简单,核心问题是距离变换。,栅格数据,缓冲区,二、基于栅格结构的缓冲区分析,109,应用举例:土地适宜性评价,1)目的:找出适宜耕种的地区2)标准:在对现有林区中开发 道路沿线300m范围内不能种值;河流沿线500m范围内不能种植。3)准备数据:道路分布图 河流分
25、布图 森林分布图,110,4)空间操作,111,112,113,114,115,7.5 叠加分析,116,地理信息系统的叠加分析,是将有关主题层组成的数据层面进行叠加,产生一个新数据层面的操作,其结果综合了原来两层或多层要素所具有的属性。叠加分析不仅包含空间关系的分析,还包含属性关系的比较。,117,GIS叠加分析可以分为以下几类:一、视觉信息叠加二、点与多边形叠加三、线与多边形叠加四、多边形叠加五、栅格图层叠加,118,一、视觉信息叠加,视觉信息叠加是将不同侧面的信息内容叠加显示在结果图件或屏幕上,以便研究者判断其相互空间关系,获得更为丰富的空间信息。,119,120,视觉信息叠加包括以下几
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ppt模板 ppt 模板 空间 数据 分析
链接地址:https://www.31ppt.com/p-4595808.html