《第三章 GIS空间分析的数据模型课件.ppt》由会员分享,可在线阅读,更多相关《第三章 GIS空间分析的数据模型课件.ppt(58页珍藏版)》请在三一办公上搜索。
1、3.4 空间分析的数据模型理论,3.4.1 空间数据及其表示,就是以不同的方式和来源获得的数据,如地图、各种专题图、图像、统计数据等,这些数据都具有能够确定空间位置的特点。 空间数据模型是关于现实世界中及其相互间联系的概念,它为描述空间数据的组织和设计空间数据库模式提供了基本方法。 因此,对空间数据模型的认识和研究在设计GIS空间数据库和发展新一代GIS系统的过程中起着举足轻重的作用。,2,整体概述,3.4.1.2 空间数据的表示 空间数据表示的基本任务,就是将以图形模拟的空间物体表示成计算机能够接受的数字形式,因此空间数据的表示必然涉及到空间数据模式和数据结构问题。 空间数据有两种基本的表示
2、模型:栅格模型和矢量模型。,3.4.2空间数据模型的类型在GIS中与空间信息有关的信息模型有三个,即基于对象(要素)(Feature)的模型、网络(Network)模型以及场(Field)模型。基于对象(要素)的模型强调了离散对象,根据它们的边界线以及它们的组成或者与它们相关的其它对象,可以详细地描述离散对象。网络模型表示了特殊对象之间的交互,如水或者交通流。场模型表示了在二维或者三维空间中,空间实体的属性信息被看作是连续变化的数据。,3.4.3 场模型,对于模拟具有一定空间内连续分布特点的现象来说,基于场的观点是合适的。 例如,空气中污染物的集中程度、地表的温度、土壤的湿度以及空气与水的流动
3、速度和方向等。 根据应用的不同,场可以表现为二维或三维。 一个二维场就是在二维空间中任何已知的地点上,都有一个表现这一现象的值; 而一个三维场就是在三维空间中对于任何位置来说都有一个值。,场模型可以表示为如下的数学公式: z : s z ( s ) 上式中,z为可度量的函数,s表示空间中的位置,因此该式表示了从空间域(甚至包括时间坐标)到某个值域的映射。,3.4.3.1 场的特征 场经常被视为由一系列等值线组成,一个等值线就是地面上所有具有相同属性值的点的有序集合。 1、空间结构特征和属性域 在实际应用中,“空间”经常是指可以进行长度和角度测量的欧几里德空间。 空间结构可以是规则的或不规则的,
4、但空间结构的分辨率和位置误差则十分重要,它们应当与空间结构设计所支持的数据类型和分析相适应。,属性域的数值可以包含以下几种类型:名称、序数、间隔和比率。 属性域的另一个特征是支持空值,如果值未知或不确定则赋予空值。,2、连续的、可微的、离散的 如果空间域函数连续的话,空间域也就是连续的,即随着空间位置的微小变化,其属性值也将发生微小变化,不会出现象数字高程模型中的悬崖那样的突变值。 只有在空间结构和属性域中恰当地定义了“微小变化”,“连续”的意义才确切。,当空间结构是二维(或更多维)时,坡度或者称为变化率,不仅取决于特殊的位置,而且取决于位置所在区域的方向分布(如图)。,图2.5 某点的坡度取
5、决于位置所在区域的各方向上的可微性,3、与方向无关的和与方向有关的(各向同性和各向异性) 空间场内部的各种性质是否随方向的变化而发生变化,是空间场的一个重要特征。 如果一个场中的所有性质都与方向无关,则称之为各向同性场(Isotropic Field)。 例如旅行时间,假如从某一个点旅行到另一个点所耗时间只与这两点之间的欧氏几何距离成正比,则从一个固定点出发,旅行一定时间所能到达的点必然是一个等时圆,如图2.6(a)所示。,(a) (b),如果某一点处有一条高速通道,则利用与不利用高速通道所产生的旅行时间是不同的,见图2.6(b)。图2.6(b)中的旅行时间与目标点和起点的方位有关,这个场称为
6、异性场(Anisotropic Field).,(a) (b),4 空间自相关空间自相关是空间场中的数值聚集程度的一种量度。距离近的事物之间的联系性强于距离远的事物之间的联系性。如果一个空间场中的类似的数值有聚集的倾向,则该空间场就表现出很强的正空间自相关;如果类似的属性值在空间上有相互排斥的倾向,则表现为负空间自相关。因此空间自相关描述了某一位置上的属性值与相邻位置上的属性值之间的关系。,3.4.4 要素模型,3.4.4.1 欧氏(Euclidean)空间和欧氏空间中的三类地物要素,将地理要素嵌入到欧氏空间中,形成了三类地物要素对象,即点对象、线对象和多边形对象。,1、点对象,点是有特定的位
7、置,维数为零的物体。,2、线对象,线对象是GIS中非常常用的维度为1的空间组分,表示对象和它们边界的空间属性,由一系列坐标表示。,3、多边形对象,面状实体也称为多边形,是对湖泊、岛屿、地块等一类现象的描述。通常在数据库中由一封闭曲线加内点来表示。,3.4.4.2 要素模型的基本概念,基于要素的空间模型强调了个体现象,该现象以独立的方式或者以与其它现象之间的关系的方式来研究。 任何现象,无论大小,都可以被确定为一个对象(Object),且假设它可以从概念上与其邻域现象相分离。 要素可以由不同的对象所组成,而且它们可以与其它的相分离的对象有特殊的关系。 要素模型适合于人工地物,例如,建筑物、道路、
8、设施和管理区域。 一些自然现象,如湖、河、岛及森林,经常被表现在基于要素的模型中,因为它们为了某些目的,可以被看成为离散的现象。,基于要素的空间信息模型把信息空间分解为对象(Object)或实体(Entity)。一个实体必须符合三个条件: (1)可被识别; (2)重要(与问题相关); (3)可被描述(有特征)。,有关实体的特征,可以通过静态属性(如城市名)、动态的行为特征和结构特征来描述实体。 与基于场的模型不同,基于要素的模型把信息空间看作许多对象(城市、集镇、村庄、区)的集合,而这些对象又具有自己的属性(如人口密度、质心和边界等)。 基于要素模型中的实体可采用多种维度来定义属性,包括:空间
9、维、时间维、图形维和文本/数字维。,空间对象之所以称为“空间的”,是因为它们存在于“空间”之中,即所谓“嵌入式空间”。 空间对象的定义取决于嵌入式空间的结构。 常用的嵌入式空间类型有: (1)欧氏空间,它允许在对象之间采用距离和方位的量度,欧氏空间中的对象可以用坐标组的集合来表示; (2)量度空间,它允许在对象之间采用距离量度(但不一定有方向); (3)拓扑空间,它允许在对象之间进行拓扑关系的描述(不一定有距离和方向); (4)面向集合的空间,它只采用一般的基于集合的关系,如包含、合并及相交等。,1、欧氏平面上的空间对象类型,图2.9表示了在连续的二维欧氏平面上的一种可能的对象继承等级图。,在
10、图2.9中,具有最高抽象层次的对象是“空间对象”类,它派生为零维的点对象和延伸对象,延伸对象又可以派生出一维和二维的对象类。一维对象的两个子类:弧和环(Loop),如果没有相交,则称为简单弧和简单环。在二维空间对象类中,连通的面对象称为面域对象,没有“洞”的简单面域对象称为域单位对象。,对象行为是由一些操作定义的。 这些操作用于一个或多个对象(运算对象),并产生一个新的对象(结果)。 可将作用于空间对象的空间操作分为两类:静态的和动态的。 静态操作不会导致运算对象发生本质的改变,而动态操作会改变(甚至生成或删除)一个或多个运算对象。,3.4.6 网络结构模型,3.4.6.1 网络模型概述,网络
11、是用于实现资源的运输和信息的交流的相互联接的线性特征。网络模型是对现实世界网络的抽象。 在模型中,网络由链(Link)、结点(Node)、站点(Stop)、中心(Center)和转向点(Turn)组成。 建立一个好的网络模型的关键是清楚地认识现实网络的各种特性与以网络模型的要素(Link, Node, Stop, Center, Turn)表示的特性的关系。,基于网络的空间模型与基于要素的模型在一些方面有共同点,因为它们经常处理离散的地物,但是最基本的特征就是需要多个要素之间的影响和交互,通常沿着与它们相连接的通道。 相关现象的精确形状并不是非常重要的,重要的是具体现象之间距离或者阻力的度量。
12、,网络模型的典型的例子就是研究交通,包括陆上、海上及航空线路,以及通过管线与隧道分析水、汽油及电力的流动。 在考虑交通问题时,讲两点之间的直线距离是没有意义的。 因为,对于交通运输而言,两点之间的传输并不是沿着两点之间的直线进行的,一切都只能是在交通运输网中的特定路径上进行。 因此,两点间的距离表现为两点之间路径的长度。 因为两点之间的相关路径可能有许多条。 因此以最短路径的长度来描述网络上两点之间的距离。,3.4.6.2 网络的组成要素,1、链(Link) 网络的Link构成了网络模型的框架。 Link表示用于实现运输和交流的相互联接的线性实体。 它可用于表示现实世界网络中的运输网络的高速公
13、路、铁路,和电网中的传输线和水文网络中的河流。 其状态属性包括阻力和需求。,2、结点(Node) Node指Link的起止点。 Link总是在Node处相交。 Node可以用来表示道路网络中道路交叉点、河网中的河流交汇点。,3、站点(Stops) Stop指在某个流路上经过的位置。 它代表现实世界中邮路系统中的邮件接收点、或高速公路网中所经过的城市。,4、中心(Center) Center指网络中一些离散位置,它们可以提供资源。 Center可以代表现实世界中的资源分发中心、购物中心、学校、机场等。 其状态属性包括资源容量,如总的资源量; 阻力限额, 如中心与链之间的最大距离或时间限制。,5、
14、转向点(Turn),Turn代表了从一个Link到另一个Link的过渡。 与其它的网络要素不同,Turn在网络模型中并不用于模拟现实世界中的实体,而是代表Link与Link之间的过渡关系。,3.4.6.3 常用的网络模型,1、网络跟踪(Trace) 网络用于研究网络中资源和信息的流向,这就是网络跟踪的过程。 在水文应用中,网络跟踪可用于跟踪污染物从污染源开始,沿溪流向下游扩散的过程。 在电网应用中,可以根据不同开关的开与关的状态,确定电力的流向。,网络跟踪中涉及的一个重要概念是“连通性”(Connectivity),这定义了网络中弧段与弧段的连接方式,也决定了资源与信息在网络中流动时的走向。
15、弧段与弧段之间的连通多数情况下是有向的,网络的流向是通过弧段的流向来决定的。 在弧段被数字化时,From结点与To结点的关系就定义了弧段的流向。,2、路径选择(Path Finding) 在远距离送货、物资派发、急救服务和邮递等服务中,经常需要在一次行程中同时访问多个站点(收货方、邮件主人、物资储备站等),如何寻找到一个最短和最经济的路径,保证访问到所有站点,同时最快最省地完成一次行程,这是很多机构经常遇到的问题。 在这类分析中,最经济的行车路线隐藏在道路网络中,道路网络的不同弧段(网络模型中的Link)有不同的影响物流通过的因素(网格模型中的Impedance:阻抗), 路径选择分析必须充分
16、考虑到这些因素,在保证遍历需要访问的站点(在网络模型中的STOP)的同时,为用户寻找出一条最经济(时间或费用)的运行路径。,3、资源分配(ALLOCATE) 反映现实世界网络中资源的供需关系模型。 “供(Supply)”代表一定数据的资源或货物,它们位于被称之为“CENTER”的设施中。 “需(Demand)”指对资源的利用。 Allocate分析就是在空间中的一个或多个点的资源分配的过程。 为了实现供需关系,在网络中必然存在资源的运输和流动。 资源要么由供方送到需方,要么由需方到供方处索取。,4、地址编码与匹配(GeoCoding) 利用人们习惯的地址(街道门牌号)信息确定它在地图上的确切位
17、置的技术,称为地址编码与匹配。 客户名单、事故报告、报警中所使用的定位信息多数是按人们习惯的街道门牌号等文字形式提供的,经常在地图上需要迅速定位, 例如110接警后,需要迅速定位求救地点,然后才可以采取进一步措施(例如寻求最优路径前往救助)。 地址编码和地址匹配就是用于解决此类问题的。,地址编码与匹配(GeoCoding),5、选址和分区(Location-Allocation)分析 Location-allocation分析是决定一个或多个服务设施的最优位置的过程,它的定位力求保证服务设施可以以最经济有效的方式为它所服务的人群提供服务。 在此分析中,既有定位过程,也有资源分配过程。 常用来解
18、决的实际问题包括: (1)加油站位置的选择; (2)急救服务站位置的选择:救火、医疗急救; (3)学校的选址。,6、空间相互作用和引力模型,用于理解和预测某点发生的活动和人、资源及信息的流动。 两点间发生多大程度的相互作用与两点的性质以及发生相互作用的消耗或费用有关。 通常情况下两点间距离越近,发生相互作用的可能性越大。 解决的实际问题包括: (1)为什么物资总是向沿海地区流动; (2)为什么某一区域的人们总是去特定的商场购物; (3)从家到电影院超过多长时间后,就不会选择去这个电影院看电影了。,6、空间相互作用和引力模型,类似于Path Finding,只是除了考虑相互作用的两个对象的距离,
19、还要考虑相互作用时发生的活动的性质。 例如,人们不愿意去距离远的商场购物,但可能愿意去较远地方的名医求医问药。,3.4.7 时空模型3.4.7.1 时空数据模型概述,1、研究概述 传统的地理信息系统应用只涉及地理信息的两个方面:空间维度和属性维度,因此也叫SGIS(Static GIS), 能够同时处理时间维度的GIS叫TGIS(Temporal GIS)。 在GIS中,具有时间维度的数据可以分为两类: (1)一类是可以称为结构化的数据,如一个测站历史数据的积累,它可以通过在属性数据表记录中简单地增加一个时间戳(Time Stamp)实现其管理;,(2)另一类是非结构化的,最典型的例子是土地利
20、用状况的变化(图2.15),描述这种数据,是TGIS数据模型的重点要解决的问题,TGIS数据模型特点是语义更丰富、对现实世界的描述更准确,其物理实现的最大困难在于海量数据的组织和存取。 TGIS技术的本质特点是“时空效率”。 当前主要的TGIS模型包括: (1)空间时间立方体模型(Space-time Cube) (2)序列快照模型(Sequent Snapshots) (3)基图修正模型(Base State with Amendments) (4)空间时间组合体模型(Space-time Composite),2、TGIS的研究思路 目前可以研究TGIS技术,以便在SGIS的框架中用TGI
21、S技术来实现TGIS功能。 对TGIS模型的研究可以本着两种思路进行平行探索:综合模型和分解模型。 先用分解模型思路针对典型应用领域(如土地利用动态监测工作)进行全面研究,同时不断丰富、充实综合模型,最后得到一个比较完善的综合模型。,3、时空数据模型设计的原则 地籍变更、海岸线变化、土地城市化、道路改线、环境变化等应用领域,需要保存并有效地管理历史变化数据,以便将来重建历史状态、跟踪变化、预测未来。 这就要求有一个组织、管理、操作时空数据的高效时空数据模型。 时空数据模型是一种有效组织和管理时态地理数据,属性、空间和时间语义更完整的地理数据模型。 一个合理的时空数据模型必须考虑以下几方面的因素
22、: 节省存储空间、加快存取速度、表现时空语义。 时空语义包括地理实体的空间结构、有效时间结构、空间关系、时态关系、地理事件、时空关系等。,时空数据模型设计的基本指导思想: (1)根据应用领域的特点(如宏观变化观测与微观变化观测)和客观现实变化规律(同步变化与异步变化、频繁变化与缓慢变化),折衷考虑时空数据的空间/属性内聚性和时态内聚性的强度,选择时间标记的对象。 对于属性,有属性数据项时间标记、实体时间标记、数据库时间标记; 对于空间,有坐标点时间标记、弧段时间标记、实体时间标记、数据库时间标记。,(2)同时提供静态(变化不活跃)、动态(变化活跃)数据建模手段(静态、动态数据类型和操作)。 当
23、前、历史的不同使用频率的数据分别组织存放,以便存取。 一般地,将当前数据存放在本地机磁盘上,而将历史数据存放在远程服务器大容量光盘上。,(3)数据结构中显式表达两种地理事件:地理实体进化事件和地理实体存亡事件。 地理实体进化事件以事件发生的相关源状态和终止状态表达。 构成地理实体存亡事件的源状态由参加事件的实体标识集合表示。 时间的本质为事件发生的序列,地理事件序列直接表明地理时间语义。,(4)时空拓扑关系一般指地理实体空间拓扑关系的拓扑事件间的时态关系。 时空拓扑关系揭示了地理实体在时间和空间上的相关性。 为了有效地表达时空拓扑关系,需要存储空间拓扑关系的时变序列。,3.4.8 三维模型,目
24、前,绝大多数的商品化GIS软件包还只是在二维平面的基础上模拟并处理现实世界上所遇到的现象和问题,而一旦涉及到处理三维问题时,往往感到力不从心,GIS处理的与地球有关的数据,即通常所说的空间数据,从本质上说是三维连续分布的。 从事关于地质、地球物理、气象、水文、采矿、地下水、灾害、污染等方面的自然现象是三维的,当这些领域的科学家试图以二维系统来描述它们时,就不能够精确地反映、分析或显示有关信息。 三维GIS的要求与二维GIS相似,但在数据采集、系统维护和界面设计等方面比二维GIS要复杂得多。,3.4.8.1 三维GIS的功能,目前,三维GIS所研究的内容以及实现的功能主要包括: 1、数据编码:是
25、采集三维数据和对其进行有效性检查的工具,有效性检查将随着数据的自然属性、表示方法和精度水平的不同而不同。 2、数据的组织和重构:这包括对三维数据的拓扑描述以及一种表示法到另一种表示法的转换(如从矢量的边界表示转换为栅格的八叉树表示)。,3.4.8.1 三维GIS的功能,3、变换:既能对所有物体或某一类物体,又能对某个物体进行平移、旋转、剪裁、比例缩放等变换。另外还可以将一个物体分解成几个以及将几个物体组合成一个。 4、查询:此功能依赖于单个物体的内在性质(如位置、形状、组成)和不同物体间的关系(如连接、相交、形状相似或构成相似)。 5、逻辑运算:通过与、或、非及异或运算符对物体进行组合运算。,
26、6计算:计算物体的体积、表面积、中心、物体之间的距离及交角等。 7分析:如计算某一类地物的分布趋势,或其它指标,以及进行模型的比较。 8建立模型: 9视觉变换:在用户选择的任何视点,以用户确定的视角、比例因子、符号来表示所有地物或某些指定物体。 10系统维护:包括数据的自动备份、安全性措施、以及网络工作管理。,3.4.8.2 三维数据结构 三维数据结构同二维一样,也存在栅格和矢量两种形式。 栅格结构使用空间索引系统,它包括将地理实体的三维空间分成细小的单元,称之为体元或体元素。 存储这种数据的最简单形式是采用三维行程编码,它是二维行程编码在三维空间的扩充。 这种编码方法可能需要大量的存储空间,
27、更为复杂的技术是八叉树,它是二维的四叉树的延伸。 三维矢量数据结构表示有多种方法,其中运用最普遍的是具有拓扑关系的三维边界表示法和八叉树表示法。,1、八叉树三维数据结构 用八叉树来表示三维形体,既可以看成是四叉树方法在三维空间的推广,也可以是用三维体素列阵表示形体方法的一种改进。 八叉树的逻辑结构如下:假设要表示的形体V可以放在一个充分大的正方体C内,C的边长为2的n次方,它的八叉树可以用以下的递归方法来定义: 八叉树的每个节点与C的一个子立方体对应,树根与C本身相对应,如果V=C,那么V的八叉树仅有树根,如果V不等于C,则C等分为八个子立方体,每个子立方体与树根的一个子节点相对应。,1、八叉
28、树三维数据结构 只要某个子立方体不是完全空白或完全为V所占据,就要被八等分,从而对应的节点也就有了八个子节点。 这样的递归判断、分割一直要进行到结点所对应的立方体或是完全空白,或者是完全为V占据,或是其大小已是预先定义的体素大小,并且对它与V之交作一定的“舍入”,使体素或认为是空白的,或认为是V占据的。,如此所生成的八叉树上的节点可分为三类: 1)灰节点,对应的立方体部分地为V所占据; 2)白节点,所对应的立方体中无V的内容; 3)黑节点,所对应的立方体全为V所占据。 后两类又称为叶结点。 由于八叉树的结构与四叉树的结构是非常相似的,所以八叉树的存储结构方式可以完全沿用四叉树的有关方法。 根据
29、不同的存储方式,八叉树也可以分别称为常规的、线形的、一对八的八叉树等等。,(1) 常规的八叉树 八叉树的存储结构是用一个有九个字段的记录来表示树中的每个结点,其中一个字段用来描述该结点的特性,其余的八个字段用来作为存放指向其八个子结点的指针。 这是最普通使用的表示树形数据的存储结构方式。 规则八叉树缺陷较多,最大的问题是指针占用了大量的空间。 因此,这种方式虽然十分自然,容易掌握,但在存储空间的使用率方面不很理想。,(2) 线形八叉树 线形八叉树注重考虑如何提高空间利用率,用某一预先确定的次序遍历八叉树,将八叉树转换成一线性表,表的每个元素与一个结点相对应。线性八叉树不仅节省存储空间,对某些运算也较为方便。如图2.16和图2.17所示。,56,Q&A问答环节敏而好学,不耻下问。学问学问,边学边问。Heisquickandeagertolearn.Learningislearningandasking.,57,结束语感谢参与本课程,也感激大家对我们工作的支持与积极的参与。课程后会发放课程满意度评估表,如果对我们课程或者工作有什么建议和意见,也请写在上边,点击进入,58,谢谢聆听THANK YOU FOR LISTENING演讲者:XX 时间:202X.XX.XX,
链接地址:https://www.31ppt.com/p-1577290.html