空间数据管理-课件.ppt
第六章 空间数据管理,6.1 数据的管理6.2 空间数据的管理6.5 空间索引6.6 元数据6.7 栅格与影像数据库6.8 时空数据模型,第六章 空间数据管理,6.1 数据的管理,计算机对数据的管理到目前为止,共经历了四个阶段:程序管理阶段文件管理阶段数据库管理阶段数据仓库阶段,数据与程序共存,顺序文件索引文件直接文件倒排文件,数据经过重构、融合等,面向主题组织,服务于决策系统,层次数据库网络数据库关系数据库面向对象数据库,1、文件管理方式,文件管理是将GIS中所有的数据都存放在自行定义的空间数据结构及其操纵工具的一个或者多个文件中,包括非结构化的空间数据、结构化的属性数据等。空间数据和属性数据两者之间通过标识码建立联系。,空间数据管理方式,各个地理信息系统应用程序对应各自的空间和属性数据文件,当两个GIS应用程序需要的数据有相同部分时,可以提出来作为公共数据文件缺点是:1)程序依赖于数据文件的存储结构,数据文件修改时,应用程序也随之需要改变。2)以文件形式共享,当多个程序共享一数据文件时,文件的修改,需得到所有应用的许可,不能达到真正的共享。,2.文件与关系数据库混合管理方式 是目前绝大多数商用GIS软件所采用的数据管理方案,已经得到广泛应用。这种方案用商用DBMS管理属性数据,用文件系统管理空间数据,空间实体位置与其属性通过标识码建立联系。两者几乎独立地组织、管理和检索,由于空间数据与属性数据分开存储,在表现地理空间数据方面缺乏完整的语义表达和存储机制;难以保证数据的存储和操作的统一ArcInfo,MapInfo,Microstation,数据库系统与文件系统比较,数据库系统的数据模型,1 层次模型2 网络模型3 关系模型4 面向对象模型,数据组织的层次关系图,层次模型表示,层次模型反映了实体之间的层次关系,简单、直观,易于理解优点:层次和关系清楚,检索路线明确;缺点:不能表示多对多的关系,对任何对象的查询都必须从层次结构的根结点开始,数据独立性较差,插入和删除操作比较复杂。,网状模型表示,网状模型反映地理世界中常见的多对多关系,支持数据重构,优点:适用于数据间相互关系非常复杂的情况,具有一定的数据独立和数据共享特性,且运行效率较高;缺点:由于网状结构的复杂性,增加了用户查询的定位困难,指针的存在使数据量大大增加,尤其是当数据间关系复杂时,关系模型表示,优点:结构灵活,可满足所有用布尔逻辑运算和数学运算规则形成的询问要求,能够搜索、组合和比较不同类型的数据,加入和删除数据都非常方便。缺点:搜索速度随关系的复杂度增加而下降,只能查找和检索满足特定关系的数据。,(1)多边形关系表,(2)边界结点关系表,(3)结点坐标表,关系模型例,对象的划分:根据对象的共性,及对它的研究目的来划分,与具体的目的、性质相联系,不同的目的就会有不同划分。,面向对象数据模型,对象的定义:无论怎样复杂的事例都可以准确地由一个对象表示,每个对象都是包含了数据集和操作集的实体。,对象与封装类继承多态,GIS中面向对象模型,1)空间地物的几何数据模型通常最高等级的类为点、线、面2)拓扑关系与面向对象模型以点或弧段对象的标识号来表示弧段和面域的相互关系3)面向对象的属性数据模型可能与几何对象的划分标准不一致,GIS中面向对象的几何数据,面向对象的属性数据模型,MapGIS空间实体模型,更接近人类面向对象实体的思维方式全面支持对象、类、子类、子类型、关系、有效性规则、数据集、地理数据库等概念对象类型覆盖GIS和CAD对模型的双重要求要素可描述任意几何复杂度的实体完善的关系定义支持多层次数据结构支持几何数据的矢量表示法和解析表示法,6.2 空间数据管理,空间数据特征传统数据库管理空间数据的局限性空间数据管理模式,1 空间特征:一般需要建立空间索引。2 非结构化特征:结构化的,即满足第一范式:每条记录定长,而空间数据数据项变长,对象包含一个或多个对象,需要嵌套记录。3 空间关系特征:拓扑数据给空间数据的一致性和完整性维护增加了复杂性。4 分类编码特征:一种地物类型对应一个属性数据表文件。多种地物类型共用一个属性数据表文件。5 海量数据特征。,空间数据特征,?,6.3 空间数据管理,空间数据特征传统数据库管理空间数据的局限性空间数据管理模式,传统数据库管理空间数据的局限性,不连续的、相关性较小的数字和字符实体类型较少,并且难以充分表达实体间复杂的空间关系存贮的数据通常为定长记录的数据只操纵和查询文字和数字信息,难以处理图形信息,?,6.3 空间数据管理,空间数据特征传统数据库管理空间数据的局限性空间数据管理模式,空间数据管理模式,基于文件管理混合结构模型扩展结构模型面向对象数据库管理,缺点:1)程序依赖于数据文件的存储结构,数据文件修改时,应用程序也随之改变。2)以文件形式共享,当多个程序共享一数据文件时,文件的修改,需得到所有应用的许可。不能达到真正的共享,即数据项、记录项的共享。,GIS应用1,空间、属性数据文件1,GIS应用2,空间、属性数据文件2,空间、属性数据文件3,基于文件的管理方式,X,两个子系统分别存储空间数据和属性数据。记录之间通过关键字联系,混合结构模型,关系数据库,空间数据文件,混合结构模型,采用文件与RDBMS的混合管理模式中图形数据文件管理系统的功能较弱,特别是在数据的安全性、一致性、完整性、并发控制以及数据损坏后的恢复方面缺少基本的功能。因而GIS软件商需要寻找能同时管理图形和属性数据的商用DBMS。,GIS软件商在标准DBMS顶层开发一个能容纳、管理空间数据的系统功能。,扩展结构模型(I)全关系型数据库管理,原理:将图形数据的变长部分处理成Binary Block字段(多媒体或变长文本)。省去大量关系连接操作,但Binary Block的读写效率比定长的属性字段慢得多,特别涉及对象的嵌套时,更慢。,Oracle Long RawInformix 4.x BLOBFoxfro GeneralSQL Server IMAGE,GIS软件商进行的扩展ESRI ArcSDEMapInfo Spatial Ware,DBMS软件商在RDBMS中进行扩展,使之能直接存储和管理非结构化的空间数据,如Informix 和Oracle等都推出了空间数据管理的专用模块,定义了操纵点、线、面、圆等空间对象的函数。主要解决空间数据的变长记录的管理,效率比二进制块的管理高得多,但仍没有解决对象的嵌套问题,空间数据结构不能由用户定义,用户不能根据GIS要求再定义,使用上受一定限制。,扩展结构模型(II)对象-关系型数据库管理,数据库软件商进行的扩展Oracle Oracle Spatial,面向对象模型最适合于空间数据的表达和管理,它不仅支持变长记录,且支持对象的嵌套,信息的继承和聚集。允许用户定义对象和对象的数据结构及它的操作。可以将空间对象根据需要,定义合适的数据结构和一组操作。这种空间数据结构可以带和不带拓扑,当带拓扑时,涉及对象的嵌套、对象的连接和对象与信息聚集。面向对象的地理数据模型的核心是对复杂对象的模拟和操作。,面向对象数据管理,当前已推出了若干OODBMS如O2等,也出现一个基于OODBMS的,但由于OODBMS价格昂贵且技术还不成熟,目前在领域不太通用。基于对象关系的SDBMS将可能成为GIS空间数据库发展的主流。,6.1 数据的管理6.2 空间数据的管理6.5 空间索引6.6 元数据6.7 栅格与影像数据库6.8 时空数据模型,第六章 空间数据管理,6.5 空间索引,什么是空间索引对存储在介质上的数据位置信息的描述为什么要建立空间索引计算机硬件技术的限制传统的数据库索引技术不适用于空间数据,?,6.5 空间索引,矩形范围索引,单元格网索引,R树索引,四叉树索引,矩形范围索引,在记录每个空间对象的坐标时,同时记录每个空间对象最大最小坐标。这样,在检索空间对象时,根据空间对象的最大最小范围,预先排除那些没有落入检索窗口内的的空间对象,仅对那些最大最小范围落在检索窗口的空间对象进行进一步的判断,最后检索出那些真正落入检索窗口内的空间对象。,假设外包矩形的坐标为gxmin,gymin,gxmax,gymax,利用SQL模型查询落在举行范围内的空间要素:SELECT id0 from owner.GeoObjeTb1 WHERE(gxminXMIN)AND(gxmaxXMIN)AND(gyminYMIN)AND(gymaxYMIN),这种方法没有建立真正的空间索引文件,而是在空间对象的数据文件中增加了最大最小范围一项,它主要靠空间计算来进行判断。当空间要素不超过30万个时,初次过滤速度快,所以矩形范围索引方法适用于中小型数据量的GIS。,单元格网索引,也叫栅格索引,它是将工作区按照一定的规则划分成格网,然后记录每个格网内所包含的空间对象。通常建立一个平行于坐标轴的正方形数字网格,把整个数据库数值空间划分成3232(或6464)的正方形网格,建立空间索引文件。,空间索引,对象索引,A,B,C,行,列,6.6.1 元数据的定义及作用,定义:地理的数据和信息资源的描述性信息。它通过对地理空间数据的内容、质量、条件和其他特征进行描述与说明,以便人们有效地定位、评价、比较、获取和使用与地理相关的数据。作用:用来组织和管理空间信息,并挖掘空间信息资源。帮助数据使用者查询所需空间信息。组织和维护一个机构对数据的投资。用来建立空间信息的数据目录和数据交换中心。提供数据转换方面的信息。,6.6.2 元数据的分类,按照元数据所描述的数据内容分:数据集系列元数据数据集元数据要素类型和要素实例元数据属性类型和属性实例元数据属性类型和属性实例元数据,6.6.3 元数据的内容,第一层是目录层,主要用于对数据集信息进行宏观描述,适合在数字地球的国家级空间信息交换中心或区域以及全球范围内管理和查询空间信息时使用。第二层是空间元数据标准的主体,由八个基本内容部分和四个引用部分组成。,6.7 栅格与影像数据库,栅格数据库可以与矢量数据库联合使用,复合显示各种专题信息细节层次模型金字塔及分块显示,时空数据库系统或数据处理技术,研究内容包括以下三个方面:(1)空间时态数据的表达 空间时态数据表达的目的在于建立空间时态一体化数据模型。它涉及到时间标志、空间时态版本的标识、空间变化类型的定义、空间拓扑与时态拓扑、空间时态数据的存储结构,以及存取策略等内容。,(2)空间时态数据的更新 空间时态数据的更新研究空间数据更新的类型、操作方法,更新对时空数据库中空间和时态拓扑的影响,以及拓扑重建等问题。(3)空间时态数据的查询 空间时态数据的查询探讨空间时态数据的各种跟踪算法,多维信息的复合、分析、可视化等。,6.8 时空数据模型,6.8.2 时态GIS数据模型,1时间片快照模型 常规的时空数据模型(如遥感图像数据的采集方式)即属于时间片快照模型。它是用一系列状态对应的地理数据来反映地理现象的时空演化过程。其中可分为矢量快照模型和栅格快照模型两类。,(1)优点可以直接在当前的地理信息系统软件中实现。当前的数据库总是处于有效状态。(2)缺点仅代表地理现象的瞬时状态,缺乏对现象所包含的对象变化的明确表现,因此不能确定地理现象所包含的对象之间在时间上的拓扑联系。由于时间片快照是对状态数据的完整存储,造成数据的冗余度极大。,