第3讲 空间数据模型和空间数据结构ppt课件.ppt
第3讲 空间数据模型和空间数据结构,本讲提要:地理空间与空间抽象空间数据概念模型空间数据与空间关系 空间数据逻辑模型 矢量空间数据结构栅格空间数据结构 矢栅一体化空间数据结构镶嵌空间数据结构三维空间数据结构,3.1 地理空间与空间抽象,地理空间 地理空间(Geographic Space)是指地球表面及近地表空间,是地球上大气圈、水圈、生物圈、岩石圈和土壤圈交互作用的区域,地球上最复杂的物理过程、化学过程、生物过程和生物地球化学过程就发生在该区域。空间现象 客观世界的现象划分为5类:可精密观测的自然对象(如建筑物边界)受采样限制的自然对象(如河流的边界)受定义限制的自然对象(如植被覆盖率大小和范围)不规则的人为对象(如行政区、TIN、Voronoi多边形)规则的人为对象(栅格、立方体元),空间实体 对复杂地理事物和现象进行简化抽象得到的不可再分割的同类对象,就是地理空间实体,简称空间实体。空间实体具有4个基本特征:空间位置特征属性特征时间特征空间关系,抽象世界,还原世界,概念数据模型地理空间中地理事物与现象的抽象概念集,是地理数据的语义解释;考虑用户需求的共性,用统一的语言描述和综合、集成各用户视图;构造概念模型应该遵循的基本原则:语义表达能力强;作为用户与GIS软件之间交流的形式化语言,应易于用户理解(如ER模型);独立于具体计算机实现;尽量与系统的逻辑模型保持同一的表达形式,不需要任何转换,或者容易向逻辑数据模型转换。,逻辑数据模型GIS描述概念数据模型中实体及其关系的逻辑结构,是系统抽象的中间层。逻辑数据模型的建立既要考虑用户易理解,又要考虑易于物理实现,易于转换成物理数据模型,例如UML建模通常所称的空间数据模型其实是空间数据的逻辑模型。物理数据模型 概念数据模型在计算机内部具体的存储形式和操作机制,即在物理磁盘上如何存放和存取,是系统抽象的最底层。空间数据结构 在逻辑数据模型和物理数据模型间,用于对逻辑数据模型描述的数据进行合理的组织,是逻辑数据模型映射为物理数据模型的中间媒介。,3.2 空间数据概念模型,以GIS观点对客观世界建立模型,考虑如下对象:不连续对象,如道路、水域、建筑物;连续变化的对象,如地形的连续变化、温度范围等;分类的对象,如植被类型、气候带、年龄段等;突发事件:事故、水灾;某种人工选择的表达方式,如点、线、面、栅格等。概念模型只能体现地理空间的某一方面。,对象模型,场模型,网络模型,地理空间数据的概念模型对象模型场模型网络模型,对象模型/要素模型将研究的整个地理空间看成一个空域,地理现象和空间实体作为独立的对象分布在该空域中,对象模型强调地理空间中的单个地理现象。按照其空间特征分为点、线、面、体四种基本对象;对象也可能由其他对象构成复杂对象,并且与其他分离的对象保持特定的关系,如点、线、面、体之间的拓扑关系;每个对象对应着一组相关的属性以区分各个不同的对象;对象模型把地理现象当作空间要素(Feature)或空间实体(Entity),一个空间要素必须同时符合三个条件:可被标识在观察中的重要程度有明确的特征且可被描述传统的地图是以对象模型进行地理空间抽象和建模的实例。,对象模型对空间要素的描述,场/域(field)模型把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、土壤湿度、地形高度以及大面积空气和水域的流速和方向等;根据不同的应用,场可以表现为二维或三维;一个二维场就是在二维空间R2中任意给定的一个空间位置上,都有一个表现某现象的属性值,即 Af(x,y)一个三维场是在三维空间R3中任意给定一个空间位置上,都对应一个属性值,即 Af(x,y,z)二维空间场一般采用6种具体的场模型来描述:,规则分布的点,不规则分布的点,规则矩形区,不规则多边形区,不规则三角形区,等值线,网络模型网络是由欧式空间R2中的若干点及它们之间相互连接的线(段)构成。网络是由一系列节点和环链组成的,在本质上,网络模型可看成对象模型的一个特例,它是由点对象和线对象之间的拓扑空间关系构成的。,概念模型的选择 许多地理现象既可采用对象模型也可采用场模型来建模。,“松树”,0 x4;4y7f(x,y)=“冷杉”,0 x3;0y4“槐树”,3x7;0y4,按对象模型的林分建模,按场模型的林分建模,3.3 空间数据与空间关系,空间数据类型地理信息中的数据类型,概括起来主要有5种:几何图形数据影像数据属性数据地形数据元数据在具有智能化的GIS中还应有规则和知识数据,空间数据的表示 在二维空间中,不同类型的空间数据都可抽象表示为点、线、面三种基本的图形要素:,空间数据的抽象表示,空间关系空间关系是指地理空间实体之间相互作用的关系。空间关系主要有:拓扑空间关系:用来描述实体间的相邻、连通、包含和相交等关系;顺序空间关系:用于描述实体在地理空间上的排列顺序,如实体之间前后、上下、左右和东、南、西、北等方位关系;度量空间关系:用于描述空间实体之间的距离远近等关系。,空间拓扑关系 地图上的拓扑关系是指图形在保持连续状态下的变形(缩放、旋转和拉伸等),但图形关系不变的性质。邻接关系:同类图形要素之间的拓扑关系,如点与点,线与线,面与面。关联关系:不同类别图形要素之间的拓扑关系,如点与线,线与点,线与面,面与点。包含关系:同类但不同级图形要素之间的拓扑关系(只有面类要素才有包含关系)。连通关系:空间图形中弧段之间的拓扑关系。,邻接关系:面:P1/P2,P4;P2/P1,P4;P3/P4;P4/P1,P2,P4点:N1/N2,N3线:A1/A2,A6,A7;A2/A1,A3,A5,A7,关联关系:点/线:N1/A1,A2,A3;N2/A1,A6,A7线/面:A1/P1;A2/P1,P2;A3/P2,P4;A4/P3,P4线/点:A1/N1,N2;A2/N1,N3;A4/N4,N4 面/线:P1/A1,A2,A7;P4/A2,A3,A5;-A4,包含关系:P4包含P3;或P3包含于P4,连通关系:A1与A2连通;A3与A5连通,节点链(弧段)多边形拓扑描述有时会产生歧意:,解决方法:链具有方向性,沿着链运动时,多边形对象总是位于链的右侧,此时链的方向为正方向。当链运动到某节点时,以节点为轴按逆时针方向旋转,选取尚未走过的链的正方向离开节点的若干链的第一个链,依以上规则跟踪完。,除结点、弧段和多边形来描述图形要素的拓扑关系外,不同类型的空间实体间也存在着拓扑关系。对于点、线、面三种类型的空间实体,它们两两之间存在着分离、相邻、重合、包含或覆盖、相交5种可能的关系。,邻接,相交,重合,相离,包含,点点,点线,点面,线面,面面,线线,不同类型空间实体间的空间关系,关系,空间数据的拓扑关系,对数据处理和空间分析具有重要的意义:拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何坐标关系有更大的稳定性,不随投影变换而变化。利用拓扑关系有利于空间要素的查询。可以根据拓扑关系重建地理实体。例如根据弧段构建多边形,实现道路的选取,进行最佳路径的选择等。,面面关系:与某个面状地物相邻的所有多边形;,线线关系:如与某个河流关联的所有支流;,点点关系:如与某个水井相距小于3Km的其它井;,线面关系:如检索某国道经过的所有县市;,面线关系:如检索某县境内所有公路;,点线关系:如检索某公路边的加油站;,点面关系:如检索某县范围内邮电所分布情况;,空间顺序关系顺序空间关系是基于空间实体在地理空间的分布,采用上下、左右、前后、东南西北等方向性名词来描述;同拓扑空间关系的形式化描述类似,也可以按点点、点线、点面、线线、线面和面面等多种组合来考察不同类型空间实体间的顺序关系;顺序空间关系必须是在对空间实体间方位进行计算后才能得出;实体间的顺序空间关系随着空间数据的投影、几何变换,顺序空间关系也会发生变化在目前的GIS中,并不对顺序空间关系进行描述和表达。,基准方向,点点顺序关系,点线顺序关系,点面顺序关系,线线顺序关系,线面顺序关系,面面顺序关系,不同类型实体间的顺序关系,度量空间关系度量空间关系主要指空间实体间的距离关系;按照拓扑空间关系中建立点点、点线、点面、线线、线面和面面等不同组合来考察不同类型空间实体间的度量关系;距离的度量可以是定量的,如按欧几里德距离计算得出A实体距离B实体500m,也可以应用与距离概念相关的概念如远近等进行定性地描述;与顺序空间关系类似,距离值随投影和几何变换而变化。建立点点的度量关系容易、点线和点面的度量关系较难,而线线、线面和面面的度量关系更为困难,涉及大量的判断和计算;在GIS中,一般也不明确描述度量空间关系;,3.4 空间数据逻辑模型,空间数据逻辑模型作为概念模型向物理模型转换的桥梁,根据概念模型确定的空间信息内容,以计算机能理解和处理的形式具体地表达空间实体及其关系。针对对象模型和场模型两类概念模型,一般采用:矢量数据模型栅格数据模型矢量栅格一体化数据模型镶嵌数据模型面向对象数据模型另外,还有三维空间数据模型、时空数据模型等,矢量数据模型 矢量数据模型起源于“Spaghetti模型”一种计算机制图模型,电力塔,5610000,5810000,杨树林,6575000,6555000,松树林,2,3,1,4,河流,5,6,栅格数据模型,点,面,线,空间对象的栅格数据模型,栅格数据模型栅格数据模型中,点实体是一个栅格单元(cell)或像元,线实体由一串彼此相连的栅格构成,面实体则由一系列相邻的栅格构成;每个栅格对应于一个或一组表示该实体的类型、等级等特征;栅格单元的形状通常是正方形,有时也采用矩形。栅格的行列信息和原点的地理位置被记录在每一层中;栅格的空间分辨率确定了描述空间现象的精细程度;若需要描述统一地理空间的不同属性,则按不同的属性将数据分层,每层描述一种属性。,栅格数据模型:数据分层,土壤,地貌,森林,建筑物,Z,Y,X,栅格数据模型:栅格单元的定义一个完整的栅格模型需要以下几个参数:栅格形状;栅格单元尺寸大小/分辨率;栅格原点;栅格的倾角;,列,行,西南角格网坐标(XWS,YWS),格网分辨率,X,栅格形状,Y,栅格数据模型:栅格单元大小,栅格数据模型:单元值确定,面积占优,重要性,A连续分布地理要素,C具有特殊意义的较小地物,A分类较细、地物斑块较小,中心点,百分比法,AB,矢量栅格一体化数据模型 在矢量栅格数据模型中,对地理空间实体同时按矢量数据模型和栅格数据模型来表述面状实体的边界采用矢量数据模型描述,而其内部采用栅格数据模型表达;线状实体一般采用矢量数据模型表达,同时将线所经过位置以栅格单元进行充填;点实体则同时描述其空间坐标以及栅格单元位置,这样则将矢量数据模型和栅格数据模型的特点有机地结合在一起。,镶嵌数据模型镶嵌(Tessellation)数据模型采用规则或不规则的小面块集合来逼近自然界不规则的地理单元,适合于用场模型抽象的地理现象;通过描述小面块的几何形态、相邻关系及面块内属性特征的变化来建立空间数据的逻辑模型;小面块之间不重叠且能完整铺满整个地理空间;根据面块的形状,镶嵌数据模型可分为规则镶嵌数据模型不规则镶嵌数据模型,规则镶嵌数据模型,不规则镶嵌数据模型,TIN和Voronoi多边形数据模型,面向对象数据模型 面向对象数据模型应用面向对象方法描述空间实体及其相互关系,特别适合于采用对象模型抽象和建模的空间实体的表达。地理空间的实体或现象可看作对象或其实例;一个对象是由描述该对象状态的一组数据和表达它的行为的一组操作(方法)组成的:例如,河流的坐标数据描述了它的位置和形状,而河流的变迁则表达了它的行为。面向对象技术将对象的属性和方法进行封装(encapsulation),另外还有分类(classification)、概括(generalization)、聚集(aggregation)、联合(association)等对象抽象技术以及继承(inheritance)和传播(propagation)等强有力的抽象工具;,Open GIS面向对象空间实体模型,表示“is a”概括关系,表示“has a”聚集关系,对象2,对象1,面向对象数据模型,三维空间数据模型,(1)面模型(Surface model)侧重于三维空间表面的表示,如地形表面,地质层面等,通过表面表示形成三维空间目标表示,其优点是便于显示和数据更新,不足之处是空间分析难以进行。(2)体模型(Volume model)侧重于三维空间体的表示,如水体,建筑物等,通过对体的描述实现三维空间目标表示。其优点是适于空间操作和分析,但存储空间占用较大,计算速度也较慢。(3)混合模型((HybridModel)为了解决应用性问题,目前多是将多种模型进行集成(面模型与体模型及体模型与体模型),从而更好地为实现显示与分析功能服务。,3D空间数据模型分类,规则体元模型,非规则体元模型,三维TIN,TIN数据组织方法,TIN数据组织方法,TEN模型,三维对象的拓扑数据模型,三维复杂实体的逻辑模型,13 类空间对象,三维对象的逻辑模型,面向对象方法对三维目标的抽象描述,时空数据模型二维空间一维时间三维空间一维时间模型:时间作为属性;序列快照模型基态修正模型时空复合模型时空立方体模型非一范式模型对象关系模型,序列快照模型,基态修正模型,关于空间数据结构空间数据结构是数据逻辑模型与数据文件格式间的桥梁,3.5 矢量空间数据结构,矢量数据结构对矢量数据模型进行数据的组织。它直接以几何空间坐标为基础,记录实体坐标及其关系,尽可能精确地表示点、线、多边形等地理实体,允许任意位置、长度和面积的精确定义。,标识码,属性,空间对象编码唯一连接几何和属性数据,数据库,独立编码,点:(x,y)线:(x1,y1),(x2,y2),(xn,yn)面:(x1,y1),(x2,y2),(x1,y1),点位字典,点:点号文件,线:点号串,面:点号串,几何 位置,实体数据结构/spaghetti数据结构,多边形数据文件,点数据文件,多边形文件,拓扑空间数据结构拓扑空间数据结构没有固定的格式,还没有形成标准,但基本原理相同;拓扑空间数据结构的共同的特点是:点是相互独立的,点连成线,线构成面;每条线始于起始结点,止于终止结点,并与左右多边形相邻接。拓扑空间数据结构主要有:索引式双重独立编码结构链状双重独立编码结构等。,索引式拓扑空间数据结构,索引式拓扑空间数据结构,点文件,边文件,多边形文件,双重独立编码结构/DIME(Dual Independent Map Encoding)编码系统,线文件,链状双重独立编码结构之一,链状双重独立编码结构之二,弧段坐标文件,弧段拓扑文件,多边形拓扑文件,3.6 栅格空间数据结构,完全栅格数据结构,层2属性值,层N属性值,数据文件,栅格1,x坐标,y坐标,层1属性值,栅格2,栅格N,栅格N,基于面域方式,基于层方式,基于栅格方式,多通道/多波段影像完全数据结构,BIP结构,BIL结构,压缩栅格数据结构 游程长度编码结构之一,(0,5),(4,3)(0,3),(4,5)(0,2),(4,4),(8,2)(0,2),(4,3),(8,3)(2,2),(4,2),(8,4)(2,3),(4,1),(8,4)(2,4),(8,4)(2,4),(8,4),(si,li),压缩栅格数据结构 游程长度编码结构之二,(0,5),(4,8)(0,3),(4,8)(0,2),(4,6),(8,8)(0,2),(4,5),(8,8)(2,2),(4,4),(8,8)(2,3),(4,4),(8,8)(2,4),(8,8)(2,4),(8,8),(si,posi),压缩栅格数据结构 四叉树结构 栅格单元数满足2n2n,递归分割,直到每一区间相同或不可再分割。常规四叉树主要在数据索引和图幅索引等方面应用,压缩栅格数据结构 线性四叉树线性四叉树则只存贮最后叶结点的信息,包括叶结点的位置编码/地址码、属性或灰度值;线性四叉树地址码,通常采用十进制Morton码(MD码):,MD码的“位”运算生成,列方向,行方向,MD码实例,栈,按MD码顺序依次提取4个栅格单元,栈顶指针,比较,入栈,压栈,栈顶指针,栈,判别,分解为行号和列号,提取连续4个栅格单元,是否相等?,将最小MD码单元对应的单元值送到栈顶,将4个栅格单元依MD码大小以此推入栈,判断栈内顺序4个元素是否相等,移动栈顶指针,合并,MD=MD+4,是,否,是,否,是,否,MD2n2n?,MD=0,终止,压缩栅格数据结构 二维行程编码结构对线性四叉树中仍存在前后叶结点相同值的情况,进一步压缩数据,将前后值相同的叶结点归并:,链码结构 链码数据结构首先采用弗里曼(Freeman)码对栅格中的线或多边形边界进行编码,然后再组织为链码结构。,起始点,4,5,5,6,7,0,1,2,2,2,起始点,链码结构文件,影像金字塔数据结构 影像金字塔结构用于图像编码和渐进式图像传输,是一种典型的分层数据结构形式,适合于栅格数据和影像数据的多分辨率组织,也是一种栅格数据或影像数据的有损压缩方式,有M-金字塔,T-金字塔等。,3.7 矢栅一体化空间数据结构,栅格、矢量数据结构的对比,一体化数据结构细分格网,将地理区域划分成多级格网:粗格网基本格网细分格网三级格网都采用线性四叉树编码用(M0、M1、M2)表示,其中M0表示点或线所通过的粗格网的MD码,是研究区的整体编码;M1表示点或线所通过的基本格网的Morton码,也是研究区的整体编码;M2表示点或线所通过的细分格网的Morton码,是基本栅格内的局部编码,点状地物一体化数据结构,线状地物一体化数据结构,面状地物一体化数据结构,3.8 镶嵌式空间数据结构,以正方形和矩形单元进行地理空间划分的规则镶嵌数据模型,采用栅格数据结构进行数据的组织;Voronoi多边形和TIN三角网采用专门的数据结构进行数据组织。,Voronoi网空间数据结构,特征点数据,Voronoi单元邻接关系表,Voronoi顶点信息表,Voronoi单元顶点组成表,TIN数据结构:以三角形为基本对象,1,3,4,5,6,2,1,2,6,8,5,4,3,7,9,12,7,11,TIN网图,三角形拓扑文件,点文件,TIN数据结构:以结点为基本对象,1,3,4,5,6,2,1,2,6,8,5,4,3,7,9,12,7,11,TIN网图,连接点文件,点文件,3.9 三维空间数据结构,八叉树数据结构,64,0,0,V,0,1,2,3,4,5,6,7,40,41,42,43,44,45,46,47,60,61,62,63,64,65,66,67,不规则四面体数据结构,表面三维TIN数据结构,TIN数据组织方法,TIN数据组织方法,三维TIN数据组织方法,点的数据结构,三角形的数据结构,边的数据结构,独立点实体的数据结构,线实体的数据结构,面实体的数据结构,体实体的数据结构,基于三维TIN的空间对象数据结构,