《空间数据管理》PPT课件.ppt
《《空间数据管理》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《空间数据管理》PPT课件.ppt(102页珍藏版)》请在三一办公上搜索。
1、空间数据管理,本章首先介绍空间数据库、与一般数据库的比较,以及空间数据库的存储方式。然后介绍了GIS中两种重要的数据结构:栅格结构和矢量结构,以及其具体的存储方式,然后比较了两种结构的特点,并给出了其相互转换算法。最后介绍了空间检索中常用的技术空间索引,介绍了一些常用的空间索引方式,如BSP树、R树、CELL树等;以及空间数据的查询功能。,1.空间数据库1.1地理信息系统与一般管理信息系统的比较,(一)两者区别 1)在硬件上,为了处理图形和图像数据,系统需要配置专门的输入和输出设备,如数字化仪、绘图机、图形图像的显示设备等;许多野外实地采集和台站的观测所得到的资源信息是模拟量形式,系统还需要配
2、置模数转换设备,这些设备往往超过中央处理机的价格,体积也比较大。2)在软件上,则要求研制专门的图形和图像数据的分析算法和处理软件,这些算法和软件又直接和数据的结构及数据库的管理方法有关。,1.空间数据库1.1地理信息系统与一般管理信息系统的比较,3)在信息处理的内容和采用目的方面,一般的管理信息系统,主要是查询检索和统计分析,处理的结果,大多是制成某种规定格式的表格数据,而地理信息系统,除了基本的信息检索和统计分析外,主要用于分析研究资源的合理开发利用,制定区域发展规划,地区的综合治理方案,对环境进行动态的监视和预测预报,为国民经济建设中的决策提供科学依据,为生产实践提供信息和指导。,1.空间
3、数据库1.1地理信息系统与一般管理信息系统的比较,(二)两者共同处两者都是以计算机为核心的信息处理系统,都具有数据量大和数据之间关系复杂的特点,也都随着数据库技术的发展在不断的改进和完善。比较起来,商用的管理信息系统发展快,用户数量大,而且已有定型的软件产品可供选用,这也促进了软件系统的标准化。地理信息系统,由于上述一些特点,多是根据具体的应用要求专门设计,数据格式和组织管理方法各不相同。,1.空间数据库1.2空间数据库,(一)数据库概念数据库就是为一定目的服务,以特定的数据存储的相关联的数据集合,它是数据管理的高级阶段,是从文件管理系统发展而来的。地理信息系统的数据库(简称空间数据库或地理数
4、据库)是某一区域内关于一定地理要素特征的数据集合。,1.空间数据库1.2空间数据库,(一)空间数据库特点数据量特别大;不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据;数据应用广泛;,1.空间数据库1.2空间数据库,(三)数据库管理系统数据库管理系统(Database Management System,DBMS)是在文件处理系统的基础上进一步发展的系统。DBMS在用户应用程序和数据文件之间起到了桥梁作用。DBMS的最大优点是提供了两者之间的数据独立性,即应用程序访问数据文件时,不必知道数据文件的物理存储结构。当数据文件的存储结构改变时,不必改变应用程序。,1.空间
5、数据库1.2空间数据库,1)采用标准DBMS存储空间数据的主要问题 GIS中空间数据记录是变长的,且要存储和维护空间数据拓扑关系;DBMS一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作。GIS需要一些复杂的图形功能,一般的DBMS不能支持;地理信息是复杂的,单个地理实体的表达需要多个文件、多条记录、或许包括大地网、特征坐标、拓扑关系、空间特征量测值、属性数据的关键字以及非空间专题属性等;具有高度内部联系的GIS数据记录需要更复杂的安全性维护系统。,1.空间数据库1.2空间数据库,2)GIS数据管理方法主要4种类型对不同的应用模型开发独立的数据管理服务,这是一种基于文件管理的处理方法
6、。在商业化的DBMS基础上开发附加系统。开发一个附加软件用于存储和管理空间数据和空间分析,使用DBMS管理属性数据。使用现有的DBMS,通常是以DBMS为核心,对系统的功能进行必要扩充,空间数据和属性数据在同一个DBMS管理之下。需要增加足够数量的软件和功能来提供空间功能和图形显示功能。重新设计一个具有空间数据和属性数据管理和分析功能的数据库系统。,1.空间数据库1.3数据与文件组织,(一)数据组织分级数据项数据项是可以定义数据的最小单位,也叫元素、基本项、字段等,数据项与现实世界实体的属性相对应,数据项有一定的取值范围,称为域,域以外的任何值对该数据项都是无意义的。记录记录是由若干相关联的数
7、据项组成,是处理和存储信息的基本单位,是关于一个实体的数据总和,构成该记录的数据项表示实体的若干属性。为了唯一标识每个记录,就必须有记录标识符,也叫关键字。记录标识符一般由记录中的第一个数据项担任,唯一标识记录的关键字称主关键字,其它标识记录的关键字称为辅关键字。,1.空间数据库1.3数据与文件组织,文件文件是一给定类型的(逻辑)记录的全部具体值的集合,文件用文件名称标识,文件根据记录的组织方式和存取方法可以分为:顺序文件、索引文件、直接文件和倒排文件等。数据库数据库是比文件更大的数据组织,数据库是具有特定联系的数据的集合,也可以看成是具有特定联系的多种类型的记录的集合。数据库的内部构造是文件
8、的集合,这些文件之间存在某种联系,不能孤立存在。,1.空间数据库1.3数据与文件组织,(二)数据间的逻辑联系 数据间的逻辑联系主要是指记录与记录之间的联系。记录是表示现实世界中的实体的。实体之间存在着一种或多种联系,这样的联系必然要反映到记录之间的联系上来。数据之间的逻辑联系主要有三种:一对一的联系;一对多的联系;多对多的联系。,1.空间数据库1.3数据与文件组织,(三)常用数据文件文件组织主要指数据记录在外存设备上的组织,它由操作系统OS进行管理,具体讲在外存设备上如何安排数据和组织数据,以及实施对数据的访问方式等问题。操作系统实现的文件组织方式,可以分为顺序文件、索引文件、直接文件和倒排文
9、件。,1.空间数据库1.3数据与文件组织,顺序文件是最简单的文件组织形式,对记录按照主关键字的顺序进行组织。索引文件索引文件除了存储记录本身(主文件)以外,还建立了若干索引表,这种带有索引表的文件叫索引文件。索引表中列出记录关键字和记录在文件中的位置(地址)。,1.空间数据库1.3数据与文件组织,直接文件 直接文件又称随机文件,其存储是根据记录关键字的值,通过某种转换方法得到一个物理存储位置,然后把记录存储在该位置上。查找时,通过同样的转换方法,可以直接得到所需要的记录。倒排文件倒排文件是带有辅索引的文件,其中辅索引是按照一些辅关键字来组织索引的。倒排文件的主要优点是在处理多索引检索时,可以在
10、辅检索中先完成查询的交、并等逻辑运算,得到结果后再对记录进行存取,从而提高查找速度。,1.空间数据库1.4矢量和栅格数据结构,矢量数据模型在矢量模型中,现实世界的要素位置和范围可以采用点、线或面表达,与它们在地图上表示相似,每一个实体的位置是用它们在坐标参考系统中的空间位置(坐标)定义。栅格数据模型在栅格模型中,空间被规则地划分为栅格(通常为正方形)。地理实体的位置和状态是用它们占据的栅格的行、列来定义的。每个栅格的大小代表了定义的空间分辨率。,1.空间数据库1.4矢量和栅格数据结构,1.空间数据库1.4矢量和栅格数据结构,2.栅格数据结构及其编码 2.1栅格数据结构,(一)定义栅格结构是最简
11、单最直接的空间数据结构,是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅仅包括指向其属性记录的指针。点用一个栅格单元表示;线状地物沿线走向的一组相邻栅格单元表示,每个栅格单元最多只有两个相邻单元在线上;面或区域用记有区域属性的相邻栅格单元的集合表示,每个栅格单元可有多于两个的相邻单元同属一个区域。,2.栅格数据结构及其编码 2.1栅格数据结构,(a)点(b)线(c)面,2.栅格数据结构及其编码 2.1栅格数据结构,(二)特点栅格结构的显著特点是:属性明显;定位隐含;易于存储;算法简单;地表是不连续,是量化和近
12、似离散的数据。,2.栅格数据结构及其编码 2.2决定栅格单元代码的方法,在决定栅格代码时尽量保持地表的真实性,保证最大的信息容量。图7-5所示的一块矩形地表区域,内部含有A、B、C三种地物类型,O点为中心点,将这个矩形区域近似地表示为栅格结构中的一个栅格单元时,可根据需要,采取如下的方式之一来决定栅格单元的代码。,2.栅格数据结构及其编码 2.2决定栅格单元代码的方法,中心点法用处于栅格中心处的地物类型或现象特性决定栅格代码,在图7-5所示的矩形区域中,中心点O落在代码为C的地物范围内,按中心点法的规则,该矩形区域相应的栅格单元代码为C,中心点法常用于具有连续分布特性的地理要素,如降雨量分布、
13、人口密度图等。面积占优法以占矩形区域面积最大的地物类型或现象特性决定栅格单元的代码,在图7-5所示的例子中,显见B类地物所占面积最大,故相应栅格代码定为B。面积占优法常用于分类较细,地物类别斑块较小的情况。,2.栅格数据结构及其编码 2.2决定栅格单元代码的方法,重要性法根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元代码,假设图7-5中A类最重要的地物类型,即A比B和C类更为重要,则栅格单元的代码应为A。重要性法常用于具有特殊意义而面积较小的地理要素,特别是点、线状地理要素,如城镇、交通枢纽、交通线、河流水系等,在栅格中代码应尽量表示这些重要地物。百分比法(长度占优法)根据
14、矩形区域内各地理要素所占面积的百分比数确定栅格单元的代码,如可记面积最大的两类BA,也可以根据B类和A类所占面积百分比数在代码中加入数字,2.栅格数据结构及其编码 2.3编码方法,(一)直接栅格编码这是最简单直观而又非常重要的一种栅格结构编码方法,通常称这种编码的图像文件为网格文件或栅格文件,栅格结构不论采用何种压缩编码方法,其逻辑原型都是直接编码网格文件。直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行都从左到右逐个象元记录,也可以奇数行地从左到右而偶数行地从右向左记录,为了特定目的还可采用其他特殊的顺序。,AAAAABBBAABBAABB,2.栅格数据结构及其编
15、码 2.3编码方法,2.栅格数据结构及其编码 2.3编码方法,(二)压缩编码方法 目前有一系列栅格数据压缩编码方法,如链码、游程长度编码、块码和四叉树编码等。其目的,就是用尽可能少的数据量记录尽可能多的信息,其类型又有信息无损编码和信息有损编码之分。信息无损编码是指编码过程中没有任何信息损失,通过解码操作可以完全恢复原来的信息,信息有损编码是指为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分相对不太重要的信息,解码时这部分难以恢复。在地理信息系统中多采用信息无损编码,而对原始遥感影像进行压缩编码时,有时也采取有损压缩编码方法。,2.栅格数据结构及其编码 2.3编码方法,链码链码又称
16、为弗里曼链码Freeman或边界链码,链码可以有效地压缩栅格数据,而且对于估算面积、长度、转折方向的凹凸度等运算十分方便,比较适合于存储图形数据。缺点是对边界进行合并和插入等修改编辑工作比较困难,对局部的修改将改变整体结构,效率较低,(3,0)21100066567,2.栅格数据结构及其编码 2.3编码方法,游程长度编码地理数据往往有较强的相关性,也就是说相邻像元的值往往是相同的。游程长度编码的基本思想是:按行或列扫描,将相邻等值的像元合并,并记录代码的重复个数。其方法有两种方案:一种编码方案是,只在各行(或列)数据的代码发生变化时依次记录该代码以及相同的代码重复的个数。,2.栅格数据结构及其
17、编码 2.3编码方法,对下图沿行方向:(0,1),(4,2),(7,5);(4,5),(7,3);(4,4),(8,2),(7,2);(0,2),(4,1),(8,3),(7,2);(0,2),(8,4),(7,1),(8,1);(0,3),(8,5);(0,4),(8,4);(0,5),(8,3)。,2.栅格数据结构及其编码 2.3编码方法,另一种游程长度编码方案就是逐个记录各行(或列)代码发生变化的位置和相应代码。沿列方向:(1,0),(2,4),(4,0),(1,4),(4,0);(1,4),(5,8),(6,0);(1,7),(2,4),(4,8),(7,0);(1,7),(2,4),
18、(3,8),(8,0);(1,7),(3,8);(1,7),(6,8);(1,7),(5,8),2.栅格数据结构及其编码 2.3编码方法,游程长度编码在栅格压缩时,数据量没有明显增加,压缩效率较高,且易于检索,叠加合并等操作,运算简单,适用于机器存储容量小,数据需大量压缩,而又要避免复杂的编码解码运算增加处理和操作时间的情况。,2.栅格数据结构及其编码 2.3编码方法,块状编码块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单元的代码组成。,(1,1,2,9),(1,3,1,9),(1,4,1,9),
19、(1,5,2,0),(1,7,2,0),(2,3,1,9),(2,4,1,0),(3,1,1,0),(3,2,1,9),(3,3,1,9),(3,4,1,0),(3,5,2,7),(3,7,2,0),(4,1,4,0),(5,5,4,7),(8,1,1,0),(8,2,1,0),(8,3,1,0),(8,4,1,0),2.栅格数据结构及其编码 2.3编码方法,(a)块码分割(b)四叉树分割,2.栅格数据结构及其编码 2.3编码方法,四叉树基本思想:四叉树将整个图像区逐步分解为一系列被单一类型区域内含的方形区域,最小的方形区域为一个栅格象元,分割的原则是,将图像区域划分为四个大小相同的象限,而每
20、个象限又可根据一定规则判断是否继续等分为次一层的四个象限,其终止判据是,不管是哪一层上的象限,只要划分到仅代表一种地物或符合既定要求的少数几种地物时,则不再继续划分,否则一直划分到单个栅格象元为止。,2.栅格数据结构及其编码 2.3编码方法,定义:将2n2n像元阵列连续地进行4象限等分,一直分到子象限中像素值单调为止,这查即形成一颗四分叉的倒向树。根:整个区域;高:深度、分几级,几次分割;叶:不能再分割的块;树叉:还需分割的块;每个树叉均有4个分叉,叫四叉树。,2.栅格数据结构及其编码 2.3编码方法,编码方法1)常规四叉树记录这棵树的叶结点外,中间结点,结点之间的联系用指针联系,每个结点需要
21、6个变量:父结点指针、四个子结点的指针和本结点的属性值。指针不仅增加了数据的存储量,还增加了操作的复杂性:如层次数(分割次数)由从父结点移到根结点的次数来确定,结点所代表的图像块的位置需要从根节点开始逐步推算下来。所以,常规四叉树并不广泛用于存储数据,其价值在于建立索引文件,进行数据检索。,2.栅格数据结构及其编码 2.3编码方法,2)线性四叉树记录叶结点的位置,深度(几次分割)和属性。地址码:定位码、Morton码(加拿大学者Morton于1966年提出)四进制、十进制。其具有以下优点:存贮量小,只对叶结点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数。线性四叉树可直接
22、寻址,通过其坐标值直接计算其Morton码,而不用建立四叉树。定位码容易存储和执行实现集合相加等组合操作。,2.栅格数据结构及其编码 2.3编码方法,四进制的Morton码1、方法1:四叉树从上而下(形成)(从整体开始)由叶结点找Morton码。A、分割一次,增加一位数字,大分割在前,小分割在后。所以,码的位数表示分割的次数。B、每一个位均是不大于3的四进制数,表达位置。由Morton找出四叉树叶结点的具体位置。,03,B,A,2.栅格数据结构及其编码 2.3编码方法,1)计算每个栅格对应的MQ MQ=2*Ib+Jb I,J化为二进制Ib,Jb 看最大的I,J,不足在前补零。其始行列号从0计。
23、2)按码的升序排成线性表,放在连续的内存块中。3)依次检查每四个相邻的MQ对应的属性值,相同合并(不同码位去掉),不同则存盘,直到没有能够合并的子块为止。,2.栅格数据结构及其编码 2.3编码方法,2.栅格数据结构及其编码 2.3编码方法,十进制的Morton码-MD,四进制Morton码直观上切合四叉树分割,但许多语言不支持四进制变量,需用十进制表示Morton码.,1、一种按位操作的方法:如行为2、列为3的栅格的MD步骤:(1)行、列号为二进制 Ib=1 0 Jb=1 1(2)I行J列交叉 1 1 0 1=13(3)再化为十进制.实质上是按左上、右上、左下、右下的顺序,从零开始对每个栅格进
24、行自然编码。,2.栅格数据结构及其编码 2.3编码方法,4.把一幅2n2n的图像压缩成线性四叉树的过程 1、按Morton码把图象读入一维数组。2、相邻的四个象元比较,一致的合并,只记录第一个象元的Morton码。循环比较所形成的大块,相同的再合并,直到不能合并为止。3、进一步用游程长度编码压缩。压缩时只记录第一个象元的Morton码。,2.栅格数据结构及其编码 2.3编码方法,右图的压缩处理过程为:1、按Morton码读入一维数组。Morton码:0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15象 元 值:A A A B A B B B A A A A B B B
25、B2、四相邻象元合并,只记录第一个象元的Morton码。0 1 2 3 4 5 6 7 8 12 A A A B A A B B A B3、由于不能进一步合并,则用游程长度编码压缩。0 3 4 6 8 12 A B A B A B,2.栅格数据结构及其编码 2.3编码方法,采用四叉树编码时,为了保证四叉树分解能不断地进行下去,要求图像必须为2n2n的栅格阵列,n为极限分割数,n+1为四叉树的最大高度或最大层数,图7-4(c)为2323的栅格,因此最多划分三次,最大层数为4,对于非标准尺寸的图像需首先通过增加背景的方法将图像扩充为2n2n的图像。,(a)点(b)线(c)面图7-4:点、线、区域的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间数据管理 空间 数据管理 PPT 课件

链接地址:https://www.31ppt.com/p-5564710.html