第三章地理信息系统的数据结构课件.ppt
1,第三章GIS的空间数据结构,3.1空间数据结构的类型,2,3.1空间数据结构的类型、,1栅格数据结构一、栅格数据结构的概念二、栅格数据结构的特点三、栅格数据的获取方法四、栅格数据单元值的确定方法五、减少栅格数据存储量的编码方法,3,栅格数据结构,就是以行、列表示的像元阵列,像元点上的值即对应着地理实体的属性或属性编码。,一、栅格数据结构的概念,4,02:草地03:耕地05:林地06:水域10:居民点,一、栅格数据结构的概念,5,一、栅格数据结构的概念,6,二、栅格数据结构的特点,特点:由于栅格数据结构是按一定规则排列的,所以,其所表示的实体位置就很容易隐含在栅格数据文件的结构之中;栅格的行列坐标可以方便地转换为其它坐标系下的坐标值;栅格文件的中的每个代码本身即明确地表明了实体的属性或属性编码;,7,栅格数据特别适合与计算机处理,特别是存储和显示;栅格数据表示的地表上的线或者面是不连续的,其表示地理实体的精度与栅格尺寸有关;相对于矢量数据结构,数据量大,8,三、栅格数据的获取方法,直接获取法:将均匀的透明格网蒙在要进行处理的专题地图上,按行列读取专题内容的编码值;,9,三、栅格数据的获取方法,10,三、栅格数据的获取方法,数据转换法:由矢量数据转换到栅格数据.,11,三、栅格数据的获取方法,扫描法:通过扫描设备(包括遥感平台)扫描得到栅格数据,扫描仪,航空航天遥感,12,四、栅格数据单元值的确定方法,中心点法(网格交点归属法):用处于栅格中心处的实体属性作为该栅格单元的属性;,13,面积占优法:以占栅格面积最大的地物属性作为该栅格单元的属性;,14,长度占优法:以占栅格行中心线长度最大的地物属性作为该栅格单元的属性;,A,B,C,A,B,C,15,重要性法:,以栅格单元内是否含有重要地物来确定该栅格单元的属性;,有无重要地物?,以该重要地物的属性作为栅格单元的属性,以其他取值方法确定栅格单元的属性,不能单独作一种取值方法用,四、栅格数据单元值的确定方法,16,分别在什么情况下适合使用何种方法:中心点法:适用于对位置精度要求高的地方,强调一个地物位置重要性时譬如连续分布地理要素,分类较细地物面积占优法:强调面积时用该方法,譬如计算土地利用面积时长度占优法:强调一个地物长度时用重要性法:强调地物重要性时,譬如具有特殊意义的较小地物,17,五、减少栅格数据存储量的编码方法,栅格数据压缩的必要性:直接的栅格数据简单,但数据量大.这对于计算机有限的储存器来讲是不易接受的.所以,采用各种方法对栅格数据进行压缩是十分必要的。有损压缩:数据压缩的同时,或多或少丢失了部分原信息;无损压缩:数据压缩不会减少原信息量,原数据可完全恢复。,18,五、栅格数据压缩编码方法,链式编码(弗里曼链码、边界链码)将多边形的边界,表示为由某一原点开始,并按某些方向确定的单位矢量链。,主要对面状数据进行,19,0,1,2,3,4,5,6,7,0,1,9,5,6,7,8,2,3,4,0,1,2,3,4,5,6,7,8,9,20,优缺点:对多边形的表示有很强的压缩能力;有一定的计算功能如多边形周长;可探测边界的走向;适用于存储多边形数据。叠置运算难于进行,如组合、相交等;相邻边界重复存储,存在数据冗余,21,游程编码从第一行开始,从左到右将若干个属性值相同的栅格视为一个游程,每个游程的数据结构表示(A,P),其中A为游程长度(所延续的列数),P为该游程像元的属性值。这样,就可以将每行栅格映射为K个游程,当K远远小于列数时,原栅格数据就得以压缩.,22,23,优点:是多种压缩算法的实现基础;易于实现检索、叠加、合并等常用操作;当图形不复杂,栅格尺寸较小时,可实现栅格数据的较大压缩。,24,四叉树编码:四叉树数据结构的概念:又称为四分树或四元树编码。就是将2n2n(n=1)的空间区域按照四个像限进行递归分割,直到子像限的值单调为止。,25,每个均值方块分解为四个方位即(西北、东北、西南和东南)四叉树顶部时根结点,内部结点用圆圈表示,叶结点用方框表示,00,01,11,10,分解顺序编码,26,四叉树编码示例:,27,四叉树的建立方法:,自上而下法:首先检查全区域,不单调时进行四分割,再逐层检查各级子像限,不单调时再进行四分割,直到划分到的各级子像限都单调为止。自下而上法:按照四个像限的顺序,逐个扫描各栅格点,并在各级像限划分的末位置审查、记录该像限的单调情况。,28,四叉树编码:,四叉树结构按其编码方式的不同又分为“常规四叉树”(CQT)和“线性四叉树”(LQT)常规四叉树除了记录叶结点之外,还要记录中间结点,结点之间借助于指针相联系。每个结点用4个叶结点指针、1个父结点指针和一个属性码共6个数据项来表达。线性四叉树只记录叶结点信息,每个结点用位置、深度和属性码4个数据项表达。,29,3.2数据结构类型,2 矢量数据结构矢量数据结构是通过记录坐标的方式,尽可能地将点、线、面地理实体表现得精确无误。其坐标空间假定为连续空间,不必象栅格数据结构那样进行量化处理。因此矢量数据能更精确地定义位置、长度和大小。除数学上的精确坐标假设外,矢量数据存储是以隐式关系以最小的存储空间存储复杂的数据。,课后思考与阅读,仔细研究阅读栅格数据的压缩编码方式,31,矢量数据结构编码的基本内容,矢量数据结构通过记录空间对象的坐标及空间关系来表达空间对象的位置。点:空间的一个坐标点;线:多个点组成的弧段;面:多个弧段组成的封闭多边形;,32,矢量数据结构编码的基本内容,标识码,属性码,空间对象编码唯一连接空间和属性数据,数据库,独立编码,点:(x,y)线:(x1,y1),(x2,y2),(xn,yn)面:(x1,y1),(x2,y2),(x1,y1),点位字典,点:点号文件,线:点号串,面:点号串,存储方法,33,点实体,34,线实体,面实体,多边形矢量编码,不但要表示位置和属性,更重要的是能表达区域的拓扑特征,如形状、邻域和层次结构等,以便使这些基本的空间单元可以作为专题图的资料进行显示和操作。,35,简单的矢量数据结构面条结构(实体式)只记录空间对象的位置坐标和属性信息,不记录拓扑关系。存储:独立存储:空间对象位置直接跟随空间对象;点位字典:点坐标独立存储,线、面由点号组成特征无拓扑关系,主要用于显示、输出及一般查询公共边重复存储,存在数据冗余,难以保证数据独立性和一致性多边形分解和合并不易进行,邻域处理较复杂;处理嵌套多边形比较麻烦适用范围:制图及一般查询,不适合复杂的空间分析,36,简单的矢量数据结构面条结构(实体式),多边形 数据项A(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),(x6,y6),(x7,y7),(x8,y8),(x9,y9),(x1,y1)B(x1,y1),(x9,y9),(x8,y8),(x17,y17),(x16,y16),(x15,y15),(x14,y14),(x13,y13),(x12,y12),(x11,y11),(x10,y10),(x1,y1)C(x24,y24),(x25,y25),(x26,y26),(x27,y27),(x28,y28),(x29,y29),(x30,y30),(x31,y31),(x24,y24)D(x19,y19),(x20,y20),(x21,y21),(x22,y22),(x23,y23),(x15,y15),(x16,y16),(x19,y19)E(x5,y5),(x18,y18),(x19,y19),(x16,y16),(x17,y17),(x8,y8),(x7,y7),(x6,y6),(x5,y5),37,索引式,线与多边形之间的树状索引,点与多边形之间的树状索引,38,双重独立式DIME(Dual lndependent Map Encoding),这种数据结构除了通过线文件生成面文件外,还需要点文件,39,链状双重独立式,链状双重独立式数据结构是DIME数据结构的一种改进。在DIME中,一条边只能用直线两端点的序号及相邻的面域来表示,而在链状数据结构中,将若干直线段合为一个弧段(或链段),每个弧段可以有许多中间点。在链状双重独立数据结构中,主要有四个文件:多边形文件、弧段文件、弧段坐标文件、结点文件。,40,弧段文件弧段号起始点终结点左多边形右多边形a51OAb85EAc168EBd195OEe1519ODf1516DBg115OBh81ABi1619DEj3131BC弧段坐标文件弧段号点 号a5,4,3,2,1b8,7,6,5c16,17,8d19,18,5e15,23,22,21,20,19f15,16,g1,10,11,12,13,14,15h8,9,1i16,19j31,30,29,28,27,26,25,24,31,链状双重独立式,多边形文件多边形号弧段号周长 面积 中心点坐标Ah,b,aBg,f,c,h,-jCjDe,i,fEe,i,d,b,41,矢量数据结构的特点,用离散的点描述空间对象与特征,定位明显,属性隐含用拓扑关系描述空间对象之间的关系面向目标操作,精度高,数据冗余度小与遥感等图象数据难以结合输出图形质量号,精度高,42,3.3两种数据结构的比较与转换,43,数据结构的转换,由于矢量数据结构和栅格数据结构各具有不同的优缺点,一般他们的应用原则是:数据采集采用矢量数据结构,有利于保证空间实体的几何精度和拓扑特性的描述;而空间分析则主要采用栅格数据结构,有利于加快系统数据的运行速度和分析应用的进程,因而在数据处理阶段,经常要进行两种数据结构的相互转换。,由矢量向栅格的转换,矢量数据的基本要素是点、线、面,因而只要实现点、线、面的转换,各种图形的相互转换问题就得以解决。,研究的区域如右图,坐标方向如图中箭头所示,区域的最大最小坐标分别为xmax,xmin,ymax,ymin。网格大小为 x y。x=(xmaxxmin)/J y=(ymaxymin)/I 一般情况下,取x=y。,0,1,2,3,j,ymax,ymin,xmax,xmin,x,y,0,1,2,3,i,x,y,点的变换,点的变换十分简单,只要这个点落在哪个网格中就属于哪个网格元素,行列坐标(i,j)可由下式计算:,i=1+Int(ymax-y)/y j=1+Int(x-xmin)/x,0,1,2,ymin,xmax,xmin,0,1,2,3,i,x,3,j,ymax,x,y,y,基于图像数据的矢量化方法,图像数据可来源于扫描、遥感分类图象等。二值化:应注意选取合适的阈值,对于一幅特定的图象,甚至需尝试不同的阈值。细化:消除线划横断面栅格数的差异,使得每一条线只保留代表其横轴线的单个栅格的宽度。“剥皮法”跟踪:跟踪整理为以起始点(或称结点)开始的线段或闭合的线条。,剥皮法,“剥皮法”的实质是从曲线的边缘开始,每次剥掉等于一个栅格宽的一层,直到最后留下彼此连通的由单个栅格点组成的图形。这一方法的最关键的技术是在剥皮过程中,不允许剥去会导致曲线不连通的栅格。,33栅格组合图,49,思考与练习,空间实体可抽象为哪几种基本类型?它们在矢量数据结构和栅格数据结构分别是如何表示的?叙述3种栅格数据存储的压缩编码方法。试写出矢量和栅格数据结构的模式,并列表比较其优缺点。,