空间数据模型与数据结构ppt课件.ppt
地理信息系统原理,北京师范大学 资源学院 岳建伟手 机:13693258471 办公电话:010-58803082电子邮箱:,2,地理信息系统概念地理信息系统组成地理信息系统功能常用的GIS软件,课堂回顾,3,空间数据模型与数据结构,4,教学目标,5,我们生活的世界,6,我们生活的世界,7,我们生活的世界,8,我们生活的世界,9,10,主要内容,一、数据模型(地理空间的认知与表达)二、GIS数据结构矢量数据结构栅格数据结构三、ArcGIS数据模型,11,一、数据模型(地理空间的认知与表达),12,我们生活的世界,矢量结构、栅格结构,抽象,13,14,15,8,P1,P2,P3,P4,P5,P6,P7,P9,P8,16,8,P1,P2,P3,P4,P5,P6,P7,P9,P8,a1,a2,a3,a4,a5,a6,a7,a9,a10,a11,a8,a12,a13,a15,a16,a17,a18,a14,a19,a20,a21,a22,a23,a24,17,8,P1,P2,P3,P4,P5,P6,P7,P9,P8,a1,a2,a3,a4,a5,a6,a7,a9,a10,a11,a8,a12,a13,a15,a16,a17,a18,a14,a19,a20,a21,a22,a23,a24,N1,N2,N3,N4,N5,N6,N7,N8,N9,N10,N11,N12,N13,模型:是对现实世界的简化表达。数据模型:是一个描述数据、数据联系、数据 语义以及一致性约束的概念工具的集合,一、数据模型,(一)概念,(二)数据模型的层次,现实世界到信息世界的过程:客观世界 数据模型 计算机管理的数据 信息世界,抽象,数据模型的抽象分为三个层次:概念 结构 计算机上存储,概念数据模型 逻辑数据模型 物理数据模型,空间数据模型是GIS抽象的中间层,即GIS的逻辑数据模型,空间数据模型:是关于现实世界中空间实体及其相互间联系的概念,建立在对地理空间的充分认识与完整抽象的地理空间认知模型(概念模型)的基础上,并用计算机能够识别和处理的形式化语言来定义和描述现实世界地理实体、地理现象及其相互关系,是现实世界到计算机世界的直接映射。,(三)空间数据模型,空间数据模型是GIS的基础,要将现实世界抽象到GIS,也需要三个层次:空间概念数据模型 空间逻辑数据模型 空间物理数据模型,(四)数据模型的类型,基于记录的数据模型:是把数据库定义为多种固定格式的记录型,每个记录型由固定数量的域或属性构成,每个域或属性具有固定的长度。包括:层次模型、网络模型、关系模型基于对象的数据模型:用于在概念和视图抽象级别上的数据描述,具有相当灵活的结构和较强的表达能力,允许明确地定义完整性约束。包括:实体联系模型、语义数据模型、函数数据模型、面向对象的数据模型,(五)三种基于记录的传统数据模型,层次模型是数据处理中发展较早、技术上也比较成熟的一种数据结构。层次模型是将数据组织成有序、有向的树结构,由处于不同层次的各个结点组成,除根结点外,其余各结点有且仅有一个上一层结点作为其“双亲”,而位于其下的较低一层的若干个结点作为其“子女”。结构中结点代表数据记录,连线描述位于不同结点数据间的从属关系(一对多的关系)。,1、层次模型,层次模型(树状结构),优点:层次分明、组织有序;缺点:数据独立性较差,难以表达多对多的关系,导致数据冗余。,2、网络模型,网络模型是数据模型的另一种重要结构,它反映了现实世界中实体间更为复杂的联系,它的结点数据间没有明确的从属关系,一个结点可与多个结点建立联系。网络模型用连接指令或指针来确定数据间的连接关系,是具有多对多类型的数据组织方式,它将数据组织成有向图结构,结点代表数据记录,连线描述不同结点数据间的关系。,网状模型,优点:能描述多对多关系;缺点:结构复杂,限制了它在空间数据表达中的应用。,3、关系模型,关系模型的理论基础是关系理论,它通过关系运算操作数据。从用户角度看,关系模型的逻辑结构是一张二维表,由行、列组成,每一行为一个元组,每一列为一个属性,也就是说,关系模型是用二维表结构来表示实体和实体之间联系的模型。,关系模型,优点:结构简单灵活,易查询,维护方便。,缺点:不适合表示非结构化数据,难以表达目标,尤其是复杂目标,效率较低。,二、空间数据模型,基于对象(要素)的数据模型基于场(域)的数据模型,(一)空间数据模型分为两类:,1、对象模型,基于对象的模型:是把空间存在的信息作为连续的、可被观测的、具有地理参照的实体来处理,强调对象的个体现象,以独立的方式或以与其他现象之间的关系的方式来处理。空间对象必须符合三个条件:可被识别、重要或必要、可被描述。可描述对象的特征有:静态属性、行为特征、结构特征。,基于对象的模型把信息空间看作是许多对象的集合,而这些对象又具有自己的属性。基于对象的模型中的实体可采用多种维度来定义属性,包括空间维、时间维、图形维、文本、数字维。,地学对象,时间,文本/数字,空间,图形,2、场(域)模型,基于场(域)的模型:是把空间存在的信息看作连续分布的空间信息的集合来处理,每个这样的分布可以表示为一个空间结构到属性域的数学函数。根据应用的不同,场(域)可以表现为二维或三维。遥感图像数据一般表现为场模型。,对于空间数据建模来说,基于场的方法和基于对象的方法并不相互排斥,两者在许多情况下可以共存、共用,以发挥各自的长处。在GIS的数据结构设计中,经常要采用这两种模型的集成。,(二)基本的空间数据模型,栅格模型-基于场的数据模型不规则三角网模型-基于场的模型矢量模型-基于对象的数据模型,1、栅格数据模型,栅格数据模型比较适宜于表示连续铺盖的空间对象;栅格可以用数字矩阵来表示,数字文件按顺序含有像元的直接地址;栅格模型中,点是一个像元,线由一串彼此相连的像元组成;栅格模型中每一个栅格像元记录着不同的属性(灰度),像元的大小是一致的;像元的形状通常是正方形,有时也有等边三角形、矩形或六边形;栅格的行列信息和原点的地理位置记录在每一层中;栅格的空间分辨率是指一个像元在地面所代表的实际面积大小;栅格数据模型的一个优点是对不同类型的空间数据层可以进行叠加操作,不需要进行复杂的几何运算。,像元的形状,2、矢量数据模型,矢量数据模型适合表达图形对象特征和进行高精度制图;在矢量数据模型中,空间实体现象由点、线、面等原型实体及其集合来表示。,空间对象的矢量模型表示,3、不规则三角网模型(TIN),TIN模型采用不规则三角形拟合地表或其他不规则表面,是建立数字地面模型或数字高程模型的主要方法之一。构成TIN的三角形应尽可能接近等边三角形,三角形大小随点的密度变化而自动变化。梯森(泰森)多边形与Delaunay三角形。,梯森多边形与Delaunay三角形,41,42,1、面向对象空间数据模型,面向对象空间数据模型是目前GIS软件采用的最新数据模型。面向对象空间数据模型:是对各种地理空间实体用对象来表示,而不是将复杂对象分解为单一的对象实体(如点、线、面、体)表示,是在关系型数据库管理系统的基础上,增加了面向对象的封装、继承、聚集、信息传播等功能而形成的数据模型。,(三)空间数据模型的趋势,2、3D数据模型,地理空间是一个三维空间,建成的GIS系统应该是三维GIS系统,但由于理论和技术上的局限,目前的GIS均为二维GIS,即将地球椭球面上的信息投影到二维平面(如,高斯投影面)上,然后对空间数据进行处理、分析、显示、输出等。三维空间数据模型比二维空间数据模型复杂得多。目前研究的较多的3D数据模型有:三维体元充填模型、结构实体几何模型、边界表示模型、面向对象模型、拓扑数据模型等。,3、时空数据模型,时空数据模型是TGIS研究的核心问题,是还处于研究阶段的问题。目前提出的时空数据模型有四种:将时间作为属性的附加项 将时间作为新的维数 面向对象建模 基于状态和变化的统一建模,46,47,二、GIS数据结构,(一)矢量数据结构(二)栅格数据结构(三)矢栅转换,(一)矢量数据结构,矢量数据结构:是通过记录坐标的方式尽可能精确地表示点、线、面(多边形)等地理实体。,1.矢量数据结构编码的基本内容,点实体线实体面实体,1)点实体,点实体包括由一对(x,y)坐标定位的一切地理或制图实体。点实体可以为:地物点、文本位置点、线段网络的结点,点实体的矢量数据结构,2)线实体,线实体主要用来表示线状地物、符号线和多边形边界,有时也称为弧、链、串等。线实体矢量编码的内容,3)面实体,多边形数据是描述地理空间信息的最重要的一类数据。多边形矢量编码,不但要表示位置和属性,更重要的是能表达区域的拓扑特征。,53,XY坐标编码表,矢量数据结构编码的基本内容,标识码,属性码,空间对象编码唯一连接空间和属性数据,数据库,独立编码,点:(x,y)线:(x1,y1),(x2,y2),(xn,yn)面:(x1,y1),(x2,y2),(x1,y1),点位字典,点:点号文件,线:点号串,面:点号串,存储方法,55,简单矢量数据结构,56,拓扑矢量数据结构,57,拓扑矢量数据结构,58,空间对象拓扑关系,3.矢量数据结构编码的方法,实体式索引式双重独立式链状双重独立式,1)实体式,实体式数据结构:是指构成多边形边界的各个线段,以多边形为单元进行组织。实体式数据结构中,边界坐标数据和多边形单元一一对应,各个多边形边界都单独编码和数字化。,实体式编码的优缺点,优点:编码容易、数字化操作简单、数据编排直观缺点:相邻多边形的公共边界数字化两次;缺少多边形的邻域信息和图形的拓扑关系;岛只作为一个单个图形,没有建立与外界多边形的联系。,2)索引式,索引式数据结构采用树状索引以减少数据冗余并间接增加邻域信息,具体方法是对所有边界点进行数字化,将坐标对以顺序方式存储,由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状索引结构。优点:缺点:,消除了相邻多边形边界的数据冗余和不一致。,处理麻烦,工作量大。,3)双重独立式,双重独立式数据结构最早由美国人口统计局研制,用来进行人口普查分析和制图,简称DIME(Dual Independent Map Encoding)系统或双重独立式的地图编码法。DIME的特点是采用了拓扑编码结构。双重独立式数据结构是对图上网状或面状要素的任何一条线段,用其两端的节点及相邻面域来定义。,双重独立式数据结构利用拓扑关系来组织数据,可以有效地进行数据存储正确性检查,同时便于对数据进行更新和检索。,4)链状双重独立式,链状双重独立式数据结构是DIME数据结构的一种改进。在DIME中,一条边只能用直线两端点的序号及相邻的面域来表示,而在链状数据结构中,将若干直线合为一个弧段(或链段),每个弧段可以有许多中间点。链状双重独立式数据结构中,主要有四个文件:多边形文件、弧段文件、弧段坐标文件(比双重独立式多出来的文件)、结点文件。,多边形文件,弧段文件,弧段坐标文件,70,(二)栅格数据结构及其编码,71,75,76,77,78,1,2,3,4,5,6,7,8,9,79,1,2,3,4,5,6,7,8,9,80,1,2,3,4,5,6,7,8,9,81,1,2,3,5,6,7,8,9,1,2,2,3,3,3,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,5,5,5,5,4,8,8,8,8,9,9,9,9,9,4,栅格代码的确定,中心点法、面积占优法、重要性法、长度占优法,83,1,2,3,5,6,7,8,9,1,2,2,3,3,3,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,5,5,5,5,4,8,8,8,8,9,9,9,9,9,4,1,1,2,2,84,1,2,3,4,5,6,7,8,9,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,7,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,5,5,5,5,5,5,5,5,5,5,4,4,4,8,8,8,8,9,9,9,9,9,9,9,9,9,2,5,85,1、栅格数据结构栅格数据结构指将空间分割成各个规则的网格单元,然后在各个格网单元内赋以空间对象相应的属性值的一种数据组织方式;栅格数据结构分为栅格矩阵结构、游程编码结构、四叉树数据结构、八叉树数据结构和十六叉树数据结构。,86,栅格数据结构,Real world,Grid,Line,Area,Value,=0=1=2=3,Row,Column,Triangles,Hexagons,RASTER,87,88,栅格数据结构模型,2.栅格数据结构及其编码,1)栅格数据结构的图形表示,2)栅格结构的建立,在专题图上均匀划分网格,确定逐个网格的代码;用扫描数字化仪,按行和列逐点扫描专题地图,将扫描数据重采样和再编码得到网格数据;从矢量数据转换得到;将经过分类解释的遥感影像数据直接输入或重新采样后输入系统中。,(1)建立栅格结构的几种途径,(2)栅格代码的确定,中心点法、面积占优法、重要性法、长度占优法,3)栅格数据组织,以像元为记录序列,不同层上同一个像元位置上的各属性值表示为一个列数组以层为基础,每一层又以像元为序记录它的坐标和属性值,一层记录完后再记录第二层以层为基础,每一层以多边形为序记录多边形的属性值和充满多边形的各像元的坐标,栅格数据组织方式,94,4)栅格结构编码的方法,95,直接栅格数据编码,游程编码,四叉树编码,直接栅格编码是将栅格看作一个数据矩阵,逐行逐个记录代码数据。可以每行都从左到右,也可奇数行从左到右,或者采用其它特殊的方法。,1、直接栅格编码,2、行程编码,行程编码又称为游程长度编码,是栅格数据压缩的重要编码方法,也是图像编码中比较简单的方式之一。行程:是指行(或列)上具有相同属性值的相邻像元的个数。(sk,lk)sk栅格的属性值(0255)lk 行程长度(两个字节,行数可达65536),行程编码分为:游程长度编码 游程终止编码 游程长度编码:(sk,lk)sk栅格的属性值 lk 游程的连续长度 游程终止编码:(sk,lk)sk栅格的属性值 lk 游程的终止列号,行程编码图及编码表,A,B,C,D,行程编码方式,行程编码的组织:是将行程编码按顺序组成行程序列表,并建立顺序表索引,从而实现对行程编码的快速访问。,行程索引文件和行程数据文件,3、块码,块码是行程编码向二维扩展的情况,又称二维行程编码,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单元的代码组成。,14个单位正方形、4个4单位正方形、2个9单位正方形、1个16单位正方形编码为:(1,1,2,0),(1,3,1,0),(1,4,1,0),(1,5,1,0),(1,6,3,4),(2,3,1,0),(2,4,2,4),(3,1,2,0),(3,3,1,4),(4,3,2,4),(4,5,1,4),(4,6,1,4),(4,7,1,8),(4,8,1,8),(5,1,1,2),(5,2,1,2),(5,5,4,8),(6,1,3,2),(6,4,1,4),(7,4,1,2),(8,4,1,2),4、链式编码,链式编码又称弗里曼编码或边界编码。链式编码将线状地物或区域边界表示为由某一起始点和在某些基本方向上的单位矢量链组成。单位矢量的长度为一个栅格单元,每个后续点可能位于其前继点的8个基本方向之一。,链式编码方式,链式编码表,费尔曼链码的编码法,假定,栅格中有一点(i,j),八方向图,费尔曼链码的方向增量表取值,o,i,j,费尔曼链码编码,等值线图,等值线的费尔曼链码表,八方向图,费尔曼链码的优缺点,优点:较强的数据压缩率,便于长度、面积计算,便于存储数据。缺点:不便于合并和插入操作,不便于叠置分析,数据冗余。,5、四叉树编码,四叉树编码是栅格数据结构的一种压缩数据的编码方法,应用前景广阔。基本思想:是把一幅图像或一幅栅格地图等分成四个子区,不断检查每个子区的所有格网值,如该子区都含有相同的值(灰度或属性),这个子区就不再往下分割;否则,把该子区再分割成四个子区,这样递归地分割,直到每个子区都只含有相同的值为止。,111,四叉树结构按其编码的方法不同,分为:常规四叉树 线性四叉树常规四叉树:记录叶结点和中间结点每个结点用六个量表示:四个叶结点指针 一个父结点指针 一个结点的属性(或灰度值)常规四叉树主要在数据索引和图幅索引等方面应用。,线性四叉树:记录最后叶结点的信息,包括结点的位置(MQ、MD码)、深度、本结点的属性(或灰度值)深度:是指处于四叉树的第几层上,由深度可 推知子区的大小。(一幅2n 2n栅格阵列的图用四叉树分割时,具有的最大深度为n,即可分为0,1,2,3,n层。)线性四叉树的编码方法:由上而下分割 自下而上合并线性四叉树的编码形式:四进制编码 十进制编码,线性四叉树只存储每个结点的三个量,数据量比常规四叉树大为减少,因而应用广泛。,基于四进制的线性四叉树编码,对一个nn(n=2k,k1)的栅格方阵组成的区域作四叉树编码,其中k为分辨率。,第一次分割成四个子象限,它们分别包括:,如果要再分割下一层,其子象限分别为:,根据上述公式可以求得任意一个象限在全区的位置。在线性四叉树编码的分割过程中,标号的位置不断增加,其标号即为Morton码,用MQ表示。MQ的每一位都是不大于3的四进制数,并且每经过一次分割,增加一位数字。最后叶结点的Morton码是所有各位上相应的象限值相加,即:MQ=q1q2q3qk=q110k+q210k-1+qk,线性四叉树的编码方法:由上而下分割 自下而上合并自上而下分割的方法需要大量重复运算,应用较少(分割方法与常规四叉树相同);自下而上的合并法应用较多,它是将二维矩阵的每个元素的下标转换成Morton码,并将元素按码的升序排列成线性表。,自下而上的合并法的建立过程:将十进制的行列号转换成二进制表示计算每个栅格单元对应的Morton码 MQ=2Ib+Jb其中,Ib、Jb分别为栅格单元行列号的二进制数。在排好序的线性表中,依次检查每4个相邻MQ码对应的栅格值,若相同,合并为一个大块;若不同,存储4个格网的参数值(MQ码、深 度、栅格值);再依此检查4个大块的值;若有一个值不同或某子块已存储,则不作合并;直到没有能够合并的子块为止。,区域的栅格表示图编码表(按MQ码计算公式)MQ码,基于十进制的线性四叉树编码,基于四进制的线性四叉树直观上很切合四叉树的分割,但大部分语言不支持四进制变量,需要用十进制的长整型量表示Morton码,这是一种浪费;基于四进制的线性四叉树的线性表的排序过程要花费较多的时间。鉴于以上两个原因,逐渐采用十进制的Morton码(MD码)作为线性四叉树的地址码,并采用自下而上的合并方法建立四叉树。,MD码的计算公式,按位操作的运算法设十进制表示的MD码的行列号在计算机内部的二进制数分别为:行 II=(inin-1i3i2i1)列 JJ=(jnjn-1j3j2j1)十进制的MD码实际上是按II、JJ的二进制数字交叉结合的结果。即 MD=injnin-1jn-1i3j3i2j2i1j1将得到的MD码由二进制数转换为十进制数,即为栅格的编码值。,例1,已知栅格单元位于第二行、第二列,求栅格的线性四叉数的十进制编码(MD码)。解:第二行、第二列的二进制形式为(010)行、(010)列 MD=(0 0 1 1 0 0)=123+122=12,例2,已知栅格的MD码为12,求其行列号。解:将12转为二进制数为:001100 隔行抽取,行号为(010),列号为(010)即行号为第二行,列号为第二列。,线性四叉树十进制编码的编码方法,先将区域栅格表示按MD码的计算公式进行编码,得到MD码的编码表,再进行归并,得到MD码。,原始栅格图,127,栅格数据结构:四种存储方式优缺点,128,矢量向栅格转换,矢量栅格二者数据结构比较,129,矢量栅格数据转换,130,线,点,面,1、矢量向栅格的转换,(1)确定栅格单元的大小,(2)点的变换,式中,INT表示取整函数。栅格点的值用点的属性表示。,(3)线的变换,求出两个端点栅格单元的行列号;求中间经过的栅格。,设线段两端点的坐标为(X1,Y1),(X1,Y1),设两个端点的行列号已经求出,其行号分别为3和7,则其中间的行号必为4、5、6。其网格中心线的坐标为:与直线交点的X坐标为:,由X值根据下式求出这点的列号J依次求出直线经过的每一各网格单元,并用直线的属性值充填这些网格,就完成了线段的转换。曲线和多边形边界经分段连续运算,可完成曲线和多边形的转换。与此类似,也可以先计算出两端点的列数,知道直线要经过哪些列,然后计算各列中心线的Y值,再求相应的行数I。,(4)面的充填,面的充填的关键问题是:使计算机能正确判断哪些栅格单元在多边形内,哪些在多边形外,因此,多边形必须严格封闭。方法:射线算法 边界点跟踪算法(扫描算法)内部点扩散法 复数积分算法 边界代数算法,射线算法,平行线扫描法铅垂线跌落法,过待检查的栅格单元所作的平行线或铅垂线与多边形相交的点数为偶数时,该栅格在多边形外,当交点数为奇数时,该栅格在多边形内。,边界点跟踪算法,多边形边界的栅格单元确定后,从边界上的某栅格单元开始,按顺时针方向跟踪单元格,以保证多边形位于前进方向的右方,将边界经过的每个格网赋予字符R、L、N中的一个,直至回到起始点。R:代表右,行数一直增加的单元为R;L:代表左,行数一直减少的单元为L;N:代表中,与相邻单元行数相同或出现极值现象的单元为N最后逐行扫描,以多边形同一属性值充填所有L与R之间的栅格单元。对于多边形中的岛,按逆时针方向跟踪,岛内不充填。,边界点跟踪法,内部点扩散算法,在多边形边界栅格确定后,寻找多边形中的一个栅格作为种子点,然后向其相邻的八个方向扩散。如果被扩散的栅格是边界栅格,就不再作为种子点向外扩散,否则继续作为种子点向外扩散,重复上述过程直到所有种子点填满该多边形为止。,内部点扩散法容易发生扩充阻塞,复数积分算法,对全部栅格阵列逐个栅格单元判断栅格归属的多边形编码,判断方法是:由待判点对每个多边形的封闭边界计算复数积分,若积分值为2i,则该待判点属于此多边形,赋予多边形编号,否则在此多边形外部,不属于该多边形。,边界代数算法,边界代数法:是基于积分求多边形的思想,通过简单的代数运算,实现多边形的矢栅转换。,搜索方法,概念:上行沿边界前进方向Y值上升为上行;下行沿边界前进方向Y值下降为下行。,1、上行时,对搜索多边形边界曲线左侧进行填充 填充值=左多边形右多边形2、下行时,对搜索多边形边界曲线左侧(从曲线前进方向看为右侧)进行填充 填充值=右多边形左多边形,填充过程,1、确定格网数,并将全部格网置为0值,得到(b)图;,2、沿弧段a上行,在图(b)的基础上,填充值=左多边形右多边形=01=-1求各网格的代数和,得到(c)图;,3、沿弧段b下行,在图(c)的基础上,填充值=右多边形左多边形=10=1求各网格的代数和,得到(d)图。,边界代数法与其他算法的不同,边界代数法不是逐点判断与边界的关系完成转换,而是根据边界的拓扑信息,通过简单的加减代数运算将边界位置信息动态地赋给各栅格点,实现了矢量格式到栅格格式的高速转换,而不需要考虑边界与搜索轨迹之间的关系。因此,该算法简单,可靠性好,各边界弧段只被搜索一次,避免了重复运算。,2、栅格向矢量的转换,矢量化:是把栅格数据转换到几何图形数据的过程。栅格数据转换成矢量数据比矢量数据转换成栅格数据复杂原因:矢量化过程涉及到大量栅格影像数据的预处理;矢量化的图常常需要表示出拓扑关系。,147,148,149,8,P1,P2,P3,P4,P5,P6,P7,P9,P8,150,8,P1,P2,P3,P4,P5,P6,P7,P9,P8,a1,a2,a3,a4,a5,a6,a7,a9,a10,a11,a8,a12,a13,a15,a16,a17,a18,a14,a19,a20,a21,a22,a23,a24,151,8,P1,P2,P3,P4,P5,P6,P7,P9,P8,a1,a2,a3,a4,a5,a6,a7,a9,a10,a11,a8,a12,a13,a15,a16,a17,a18,a14,a19,a20,a21,a22,a23,a24,N1,N2,N3,N4,N5,N6,N7,N8,N9,N10,N11,N12,N13,2、栅格向矢量的转换,分类图,边值提取,二值化,扫描图,二值化,细化,编辑,矢量化,(1)边界提取,边界提取是遥感影像处理中的一个专门问题。一种边界提取方法:用一个22的栅格窗口,按顺序沿行列方向对栅格图像进行扫描:若窗口内的四个格网点值相同,它们就属于一个等值区,无边界通过;否则,就存在多边形的边界或边界结点若窗口内有两种栅格值,这四个栅格均标识为边界点,同时保留原栅格值,如果窗口内有三个以上不同的值,则标识为结点。对于对角线上两两相同的情况,由于造成多边形的不连通,也作为边界处理。,边界搜索按线段逐个进行。从搜索到的某一边界窗口开始,下一点组的搜索方向由进入当前点组的搜索方向和将要搜索的后续点的可能走向决定。,(2)二值化,二值化:是将彩色或灰度扫描数据的像元用 1位即0和1表示,使栅格数据以黑白显示。,二值化的关键:是在灰度级(0255)的范围 内取一个阈值,使小于阈值的灰度级取 值为0,大于阈值的灰度级取值为1。,二值化的方法,对栅格数据进行预处理;栅格数据的预处理:是对栅格图上的污点、污迹、断线、线轮廓凹凸不平等现象通过人工交互编辑的方式处理掉或修补上,如通过低通滤波除去污迹,通过高通滤波除去污点。选择阈值;二值化。,注:高通滤波,高通滤波:是消除图像的低频组份,而让高频组份通过保留,可以使图像锐化和边缘增强。,注:低通滤波,低通滤波:是消除图像的高频组份,而让低频组份通过,使图像更加平滑和柔和。,(3)细化,细化也称为栅格数据的轴化,就是将占有多个栅格款的图形要素缩减为只有单个栅格宽的图形要素的过程。细化的常用方法有:剥皮法、骨架法,细化处理的“剥皮法”,细化处理的“骨架法”,骨架法:是确定图形的骨架,将非骨架上的多余栅格删除。方法:扫描全图,凡是像元值为1的栅格都用V值取代。V是该栅格与北、东和北东三个相邻栅格像元之和,即:,(4)矢量化,找出线段经过的栅格;将栅格(i,j)坐标变成直角坐标(X,Y)。,165,矢栅转换总结,166,167,Coverage数据格式Shapefile数据格式Geodatabase,三、ArcGIS数据模型,168,Coverage数据格式,是基于拓扑的矢量数据格式,包括点、线和面。Coverage支持以下三种基本拓扑关系:连接性:弧段间通过节点彼此连接;面定义:由一系列相连的弧段定义面;邻接性:弧段有方向性,且有左多边形和右多边形,三、ArcGIS数据模型:Coverage,169,一、点:Tic Label Node Node(点状地物)Vertex二、线:ARC三、面:PolygonRegion,三、ArcGIS数据模型:Coverage,170,三、ArcGIS数据模型:Shapefile,Shapefile,ESRI产品中标准非拓扑数据格式,点是用一对x,y坐标,线是用一系列的点,多边形用一系列的线来存储,但是没有描述几何对象空间关系的文件。Shapefile多边形对于共享边界实际上有重复弧段且彼此重叠。几何学性质存储于两个基本文件:以.shp为扩展名的文件存储要素几何学特征,而以.shx为扩展名的文件保留要素几何学特征的空间索引。,171,三、ArcGIS数据模型:Geodatabase,Geodatabase,数据模型用点、线和多边形来表示矢量空间要素Geodatabase数据模型中,要素类和要素数据集的区别在于数据结构。要素类存储具有相同几何类型的空间数据,要素数据集存储具有相同坐标系和区域范围的要素类。要素类未必非得包括在要素类成为独立要素类。要素数据集中包含的要素类通常与其他要素类有拓扑关系Personal Geodatabase和File Geodatabase区别,172,课 堂 总 结,矢量、栅格数据结构的区别栅格数据的四种存储方式Shapefile、Coverage和Geodatabase区别,173,结 束,