空间数据结构与管理.ppt
《空间数据结构与管理.ppt》由会员分享,可在线阅读,更多相关《空间数据结构与管理.ppt(54页珍藏版)》请在三一办公上搜索。
1、3.2.1 空间数据结构 3.2.2 空间数据管理,第二节 空间数据结构与空间数据管理,3.2.1 空间数据结构,地理信息系统空间数据结构是指空间数据的编排方式和组织关系。空间数据编码是空间数据结构的实现,目的是将图形数据、影像数据、统计数据等资料,按一定的数据结构转换为适用于计算机存储和处理的形式。一种高效率的数据结构应具:(1)能够正确表示要素之间的层次关系,便于不同数据联接和覆盖。(2)正确反映地理实体的空间排列方式和各实体间相互关系。(3)便于存取和检索。(4)节省存贮空间,减少数据冗余。(5)存取速度快,在运算速度较慢的微机上要达到快速响应。(6)足够灵活性,数据组织具有插入新数据、
2、删除或修改部分数据的基本功能。,GIS支持的空间数据结构:矢量数据结构 栅格数据结构 矢量栅格混合数据结构,栅格数据单元格经常是矩形(主要是正方形)的,但可以随应用的需要进行具体设定,比如设置为三角形。栅格数据的比例尺就是栅格大小与地表相应单元大小之比。栅格尺寸越小,其分辨率越高,数据量也越大。栅格单元中存在多种地物,导致属性误差,“混合像元”问题。,一、栅格数据结构,栅格数据结构是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个像元或像素由行、列定义,并包含一个代码表示该像素的属性类型或量值,或仅仅包括指向其属性记录的指针,表示地物或现象的非几何属性特征。,属性明显:数据直接记
3、录了属性或指向属性的指针,可以直接得到地物的属性代码。定位隐含:栅格结构是按一定的规则排列的,实体位置隐含在格网文件的存储结构中。栅格数据结构容易实现,算法简单,且易于扩充、修改,也很直观,特别是易于同遥感影像的结合处理,给地理空间数据处理带来了极大的方便。,1、栅格数据结构特点,2、栅格数据取值方法,中心归属法:每个栅格单元的值以网格中心点对应的面域属性值来确定。长度占优法:每个栅格单元的值以网格中线(水平或垂直)的大部分长度所对应的面域的属性值来确定。面积占优法:每个栅格单元的值以在该网格单元中占据最大面积的属性值来确定。重要性法:根据栅格内不同地物的重要性程度,选取特别重要的空间实体决定
4、对应的栅格单元值,如稀有金属矿产区,其所在区域尽管面积很小或不位于中心,也应采取保留的原则。,3、栅格数据获取途径,手工获取,专题图上划分均匀网格,逐个决定其网格代码。扫描仪扫描专题图的图像数据行、列、颜色(灰度),定义颜色与属性对应表,用相应属性代替相应颜色,得到(行、列、属性)再进行栅格编码、存贮,即得该专题图的栅格数据。由矢量数据转换而来。遥感影像数据,对地面景像的辐射和反射能量的扫描抽样,并按不同的光谱段量化后,以数字形式记录下来的像素值序列。格网DEM数据,当属性值为地面高程,则为格网DEM,通过DEM内插得到。,常用栅格排列顺序,4、简单栅格数据排列方式,遥感图像数据排列方式,(1
5、)BSQ方式:各波段的二维图像数据按波段顺序排列。(2)BIL方式:对每一行中代表一个波段的光谱值进行排列,然后按波段顺序排列该行。(3)BIP方式:在一行中,每个像元按光谱波段次序进行排列。,每个像元可能是占一个字节的整型数。如果图像比较大,这种逐点存储的方式,所占的空间是十分巨大的。所以在实际存储时,多采用压缩存储的方式。,压缩编码的目的是用尽可能少的数据量记录尽可能多的信息,类型分为:信息无损编码:编码过程中没有任何信息损失,通过解码操作可以完全恢复原来的信息。信息有损编码:为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分相对不太重要的信息,解码时这部分难以恢复。在地理信息系
6、统中的压缩编码多采用信息无损编码,而对原始遥感影像进行压缩时也可以采取有损压缩编码方法。但数据压缩所获得的空间节省与数据处理的时间花费往往是成正比例,即所节省的空间越多,数据压缩与解压所需的时间往往也多,因此所采取的方法要根据实际情况而定。,5、栅格数据存储的压缩编码,、行程编码,行程编码1只在各行(或列)数据的代码发生变化时依次记录该代码以及相同代码重复的个数。,行程编码2逐个记录各行(或列)代码发生变化的位置和相应的代码,下图可沿列方向进行行程编码:1列:(1,3),(3,1);2列:(1,3),(4,1);3列:(1,3),(5,1);4列:(1,4),(2,3),(5,1);5列:(1
7、,4),(4,3),(6,2),(7,1);6列:(1,4),(4,2);7列:(1,4),(4,2);8列:(1,4),(3,2)。,行程编码优缺点,优点:压缩效率较高,且易于进行检索,叠加合并等操作,运算简单,适用于机器存储容量小,数据需大量压缩,而又要避免复杂的编码解码运算增加处理和操作时间的情况。缺点:对于图斑破碎,属性和边界多变的数据压缩效率较低,甚至压缩后的数据量比原始数据还大。,把多边形范围划分成由像元组成的正方形,然后对各个正方形进行编码。块式编码数据结构中包括3个数字:块的初始位置(行、列号)和块的大小(块包括的像元数),再加上记录单元的代码组成。,、块式编码,行程和块式编码
8、都对大而简单的多边形更有效,块式编码对多边形之间求并和求交较方便。,、四叉树编码,根据栅格数据二维空间分布特点,将空间区域按照4个象限进行递归分割(2n2n,且n1),直到子象限的数值单调为止,最后得到一棵四分叉的倒向树。四叉树分解,各子象限大小不完全一样,但都是同代码栅格单元组成的子块,其中最上面的一个结点叫做根结点,对应于整个图形。不能再分的结点称为叶子结点,可能落在不同层上,该结点代表子象限单一的代码,所有叶子结点所代表的方形区域覆盖了整个图形。从上到下,从左到右为叶子结点编号,最下面的一排数字表示各子区的代码。为了保证四叉树分解能不断的进行下去,要求图形必须为2n2n的栅格阵列。n 为
9、极限分割次数,n1是四叉树最大层数或最大高度。为了在计算机中既能以最小的冗余存储与图像对应的四叉树,又能方便地完成各种图形操作,专家们已提出多种编码方式。,美国马里兰大学采用的四叉树编码方法是:记录每个叶子结点的地址和值,值就是子区的代码,其中地址包括两个部分,共占有32位(二进制),最右边四位记录该叶子结点的深度,即处于四叉树的第几层上,有了深度可以推知子区的大小;地址由从根结点到该叶子结点的路径表示。0,1,2,3分别表示NW、NE、SW、SE,从右边第五位开始2n字节记录这些方向。,第5个结点深度为4,第一层为根结点,第二层处于SW象限记为2,第三层处于NE象限记为1,第四层处于SE象限
10、记为3,表示为二进制为:0000000(22位)100111(6位)0100(4位)每层象限位置由二位二进制表示。这样,记录了各个叶子的地址,再记上相应的代码值,就记录了整个图像,并可在此编码的基础上进行多种图像操作。,四叉树编码的优缺点,优点容易而有效地计算多边形的数量特征;阵列各部分的分辨率是可变的,边界复杂部分四叉树较高,即分级多,分辨率也高,而不需要表示许多细节的部分则分级少,分辨率低,因而既可精确表示图形结构又可减少存储量;栅格到四叉树及四叉树到简单栅格结构的转换比其他压缩方法容易;多边形中嵌套异类多边形的表示较方便,是优秀的栅格压缩编码之一。缺点 其最大不足是其不稳定性,即同样的原
11、始数据应用不同的算法进行编码可能会得到不同的编码结果。不利于形状分析和模式识别。,二、矢量数据结构,矢量是具有一定大小和方向的量,数学上和物理上也叫向量。线段长度表示大小,线段端点的顺序表示方向。有向线段用一系列有序特征点表示,有向线段集合就构成了图形。矢量数据就是代表地图图形的各离散点平面坐标(x,y)的有序集合。矢量数据结构是通过记录坐标的方式,尽可能地将点、线、面地理实体表现得精确无误。其坐标空间假定为连续空间,不必象栅格数据结构那样进行量化处理。因此矢量数据能更精确地定义位置、长度和大小。矢量结构允许最复杂的数据以最小的数据冗余进行存储,相对栅格结构来说,数据精度高,所占空间小,是高效
12、的空间数据结构。其精度仅受数字化设备的精度和数值记录字长的限制。,定位明显:其定位是根据坐标直接存储的,无需任何推算。属性隐含:属性则一般存于文件头或数据结构中某些特定的位置上。矢量数据结构图形运算的算法总体上比栅格数据结构复杂的多,在叠加运算、邻域搜索等操作时比较困难,有些甚至难以实现,在计算长度、面积、形状和图形编辑、几何变换操作中,矢量结构有很高的效率和精度。,1矢量数据结构特点,2、空间实体类型,点:空间上不能再分的地理实体,可以是具体的或抽象的,如地物点、文本位置点或线段网络的结点等,由一对x、y坐标表示。地面上的矿点、水井、高程控制水准点等都是点实体。线:空间上具有一定延伸方向性的
13、线状地物,由一组有序点组成,采用一组有序的(X,Y)坐标来表示。如河流和道路、断层、地质体分界线等为线状地物。面:指有封闭边界和面积的实体,由一组有序线段包围而成区域。采用一组首尾位置重合的有序线段表示。例如湖泊、矿区、土壤类型等。,从几何上来说,资源空间目标可划分为点、线、面、体四种基本类型。对表示在地图中的各种要素都可抽象为点、线、面几何图形的实体。,3、矢量数据获取途径,1)由外业测量获得 利用测量仪器自动记录测量成果(常称为电子手薄),然后转到地理数据库。2)由栅格数据转换获得 利用栅格数据矢量化技术,把栅格数据转换为矢量数据。3)跟踪数字化 用跟踪数字化的方法,把地图变成离散的矢量数
14、据。,对于点实体矢量结构中只记录其在特定坐标系下的坐标和属性代码。,点实体数据编码,4、矢量数据编码,唯一标识码是系统排列序号;线标识码可以标识线的类型;起始点和终止点号可直接用坐标表示;显示信息是显示时的文本或符号等;与线相联系的非几何属性可以直接存储于线文件中,也可单独存储,而由标识码联接查找。,线实体矢量数据编码,多边形实体矢量数据编码,多边形矢量编码不但要表示空间图形为多边形的面状实体的位置和属性,更为重要的是要能表达区域的拓扑性质,如形状、邻域和层次等,以便使这些基本的空间单元可以作为专题图资料进行显示和操作,其编码比点和线实体的矢量编码要复杂得多,也更为重要。它与机助制图系统仅为显
15、示和制图目的而设计的编码有很大不同。编码方法:坐标序列法、树状索引编码法、拓扑结构编码法。,坐标序列法,由多形边界的x、y坐标对集合及说明信息组成,是最简单的一种多边形矢量编码。,一个区域或一幅地图可以划分成许多多边形,多边形4由、弧段组成,文件编码坐标为:x9,y9;x8,y8;x7,y7;x20,y20;x21,y21;x22,y22;x23,y23;x24,y24;x18,y18;x18,y18;x19,y19。每个多边形在数据库中是相互独立、分开存储的。,坐标序列法的优缺点,优点:文件结构简单,易于实现以多边形为单位的运算和显示。缺点:多边形之间的公共边界被数字化和存储两次,由此产生冗
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据结构 管理
链接地址:https://www.31ppt.com/p-5372279.html