《空间数据采集和处理.ppt》由会员分享,可在线阅读,更多相关《空间数据采集和处理.ppt(150页珍藏版)》请在三一办公上搜索。
1、第五章 空间数据采集和处理,1、空间数据源2、数据采集3、数据编辑与处理4、空间数据质量及其精度分析,本章主要内容,整个地理信息系统就是围绕着空间数据采集、处理、存储、分析和表现而展开的,因此整个空间数据来源、采集手段、生成工艺、数据质量都直接影响整个地理信息系统应用的潜力、成本和效率。,以数据为处理线索硬件软件数据=12 7,数据采集在GIS中的地位,7,数字线化数据 地形测图思想:点、线、面影像数据数字高程模型属性数据 是什么,判读和考察 详细描述信息,GIS数据的内容,将现有的地图、外业观测成果、航空像片、遥感图片数据、文本资料等转换成GIS可以接受的数字形式。数据库入库之前进行验证、修
2、改、编辑等处理,保证数据在内容和逻辑上的一致性。不同的数据来源要用到不同的设备和方法。数据的转换数据处理:几何纠正、图幅拼接、拓扑生成等,数据采集的任务,第一节 空间数据源,(一)数据源的分类(二)数据源特征(三)空间数据采集与处理的基本流程,图形图像数据:地图、工程图、规划图照片、航空与遥感影像等文字数据:调查报告、文件统计数据实验数据野外调查的原始记录等,(一)数据源种类,(一)数据源种类,(一)数据源的分类,1、地图数据 具有共同参考坐标系统的点、线、面的二维平面形式的表示,主要普通地图和专题地图。在应用地图数据时应注意以下几点:(1)地图存储介质的缺陷(2)地图现势性较差(3)地图投影
3、的转换,(二)数据源的特征,2、遥感数据,卫星遥感影像,航空影像,遥感影像数据特征:(1)能取得大面积、综合的信息;(2)速度快;(3)降低数据储存冗余和不连续性;(4)能提供各类专题所需要的信息。每种遥感影像都有其自身的成像规律、变形规律,所以在应用时要注意影像的纠正、影像的分辨率、影像的解译特征等方面的问题。,3、实测数据 主要指各种野外实验、实地测量所得数据,它们通过转换可直接进入GIS的空间数据库以用于实时分析和进一步应用。其中,GPS点位数据、地籍测量数据等通常具有较高的精度和较好的现势性,是GIS的重要数据来源。4、统计数据 许多部门和机构都拥有不同领域大量统计资料、国民经济的各种
4、统计数据,这些常常也是GIS的数据源,尤其是属性数据的重要来源。统计数据一般都是和一定范围内的统计单元或观测点联系在一起。,5、多媒体数据 由多媒体设备获取的数据(包括声音、录像等)也是GIS的数据源之一,目前其主要功能是辅助GIS的分析和查询,可通过通讯口传入GIS的空间数据库中。6、文本资料数据 主要用来描述空间对象的属性,各种文字报告和立法文件在一些管理类的GIS系统中,有很大的应用,如在城市规划管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用。,(三)空间数据采集与处理的基本流程,1、数据源的选择2、采集方法的确定3、数据的编辑和处理4、数据质量控制与评价5、数
5、据入库,1、数据源的选择(1)是否能够满足系统功能的要求;(2)所选数据源是否已有使用经验;(3)系统成本。,(三)空间数据采集与处理的基本流程,2、数据源与相应设备,地图,地面测量数据,统计资料,航空、遥感,文字数据,多媒体,坐标几何,数字化仪,扫描仪,摄影测量系统,键盘,空间数据库,编辑处理,数据交换,3、采集方法的确定,各种方法所采集的原始空间数据,都不可避免地存在着错误或误差,属性数据在建库输入时,也难免会存在错误,所以对图形数据和属性数据进行一定的检查、编辑是很有必要的。不同系统对图形的数学基础、数据结构等可能会有不同的要求,往往需要进行数学基础、数据结构的转换。此外,根据系统分析功
6、能的要求,需要对数据进行图形拼接、拓扑生成等处理。,4、数据的编辑和处理,无论何种数据源,使用何种方法进行采集,都不可避免地存在各种类型的误差,而且误差会在数据处理及系统的各个环节之中累计和传播。对于数据质量的控制和评价是系统有效运行的重要保障和系统分析结果可靠性的前提条件之一。6、数据入库,5、数据质量控制与评价,运用各种技术手段,通过各种渠收集数据的过程。GIS的数据采集包括两个方面内容:(一)空间数据的采集(二)属性数据的采集,第二 节 数据采集,1、野外数据采集2、地图数字化3、摄影测量方法4、遥感图像处理,(一)空间数据的采集,空间数据采集流程,计划调查,编辑处理,评价,准备收集,数
7、字化,手扶跟踪数字化仪采集摄影测量数字化采集扫描跟踪数字化采集外业实地数字化采集 选择采集方法的依据是如何应用图形数据,图形数据类型,现有设备状况,现有人力,物力,财力状况等。,空间数据采集方法,包括大平板测量和小平板测量,测绘的是纸质地图。在传统的大比例尺地形图的生产过程中,一般在野外测量绘制铅笔草图,然后用小笔尖转绘在聚酯薄膜上,之后可以晒成蓝图提供给用户使用。当然也可以对铅笔草图进行手扶跟踪或扫描数字化使平板测量结果转变为数字数据。,大平板仪,1、野外数据采集,(1)平板测量:,平板仪测量,全野外数据采集设备是全站仪加电子手簿或电子平板配以相应的采集和编辑软件,作业分为编码和无码两种方法
8、。数字化测绘记录设备以电子手簿为主。还可采用电子平板内外业一体化的作业方法,即利用电子平板(便携机)在野外进行碎部点展绘成图。,全野外数字测图,(2)全野外数字测图,全野外数据采集测量工作包括:图根控制测量测站点的增补地形碎部点的测量,(3)空间定位测量,利用多颗导航卫星的无线电信号,对地球表面某地点进行定位、报时或对地表移动物体进行导航的技术系统。,全球定位系统的构成:导航卫星、地面站、GPS接收机三部分。,Navigation,Precise positioning,Time dissemination,建成后的“伽利略”全球定位系统,GLONASS系统的卫星星座由24颗卫星组成,均匀分布
9、在3个近圆形的轨道平面上,每个轨道面8颗卫星,轨道高度19100公里,运行周期11小时15分,轨道倾角64.8。,北斗卫星导航系统,2、地图数字化 指根据现有纸质地图,通过手扶跟踪或扫描矢量化的方法,生产出可在计算机上进行存储、处理和分析的数字化数据。(1)手扶跟踪数字化 这种方式数字化的速度比较慢,工作量大,自动化程度低,数字化精度与作业员的操作有很大关系,所以目前已基本上不再采用。,手扶跟踪数字化,通过数字化仪获取是一种最普通的传统方法。,是单调而细致的工作,(2)扫描矢量化地图数字化一般采用扫描矢量化的方法。根据地图幅面大小,选择合适规格的扫描仪,对纸质地图扫描生成栅格图像。然后在经过几
10、何纠正之后,即可进行矢量化。两种方式:软件自动矢量化和屏幕鼠标跟踪矢量化扫描获得的是栅格数据,数据量比较大。除此之外,扫描获得的数据还存在着噪声和中间色调像元的处理问题。噪声是指不属于地图内容的斑点污渍和其它模糊不清的东西形成的像元灰度值。噪音范围很广,没有简单有效的方法能加以完全消除,有的软件能去除一些小的脏点。,(2)扫描矢量化,工程扫描仪,小型扫描仪,扫描软件,原始地图,扫 描,栅格文件,栅格编辑,矢 量 化,矢量文件,矢量编辑,格式转换,GIS数据库,地图扫描矢量化的工作流程,3、摄影测量的方法,航测上对立体覆盖的要求是当飞机沿一条航线飞行时相机拍摄的任意相邻两张像片的重叠度(航向重叠
11、)不少于55%-65%,在相邻航线上的两张相邻像片的旁向重叠应保持在30%。,摄影测量通常采用立体摄影测量方法采集某一地区空间数据,对同一地区同时摄取两张或多张重叠的像片,在室内的光学仪器上或计算机内恢复它们的摄影方位,重构地形表面,即把野外的地形表面搬到室内进行观测。,通常所称的遥感影像数据指的是卫星遥感影像,其信息获取方式与航空像片不同。地面接受太阳辐射,地表各类地物对其反射的特性各不相同,搭载在卫星上的传感器捕捉并记录这种信息,之后将数据传输回地面,然后从所得数据。经过一系列处理过程,可得到满足GIS需求的数据。,4、遥感图像处理,传感器,1、属性数据的来源2、属性数据的分类3、属性数据
12、的编码,(二)属性数据的采集,国家资源和环境信息系统数据规范在“专业数据分类和数据项目建议总表”中,将数据分为社会环境、自然环境和资源与能源三大类共14小项,并规定了每项数据的内容及基本数据来源。,1、属性数据的来源,专业数据分类和数据项目建议总表,分类是人们认识事物的一种方法,是将具有共同属性特征的事物归并在一起,而把具有不同属性特征的事物分开的过程。,2、属性数据的分类,最常用的分类方法是层次分类法。,编码:是指确定属性数据的代码的方法和过程。代码:是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础。
13、,3、属性数据的编码,(1)系统性和科学性(2)一致性(3)标准化和通用性(4)编码的简捷性(5)编码的可扩展性,编码的原则:,登记部分:用来标识属性数据的序号,可以是简单的连续编号,也可划分不同层次进行顺序编码;分类部分:用来标识属性的地理特征,可采用多位代码反映多种特征;控制部分:用来通过一定的查错算法,检查在编码、录入和传输中的错误,在属性数据量较大情况下具有重要意义。,属性数据的编码编码内容,(1)列出全部制图对象清单;(2)制定对象分类、分级原则和指标,将制图对象进行分类、分级;(3)拟定分类代码系统;(4)设定代码及其格式。设定代码使用的字符和数字、码位长度、码位分配等;(5)建立
14、代码和编码对象的对照表。这是编码最终成果档案,是数据输入计算机进行编码的依据。,无标准的编码方法,(1)层次分类编码法:是按照分类对象的从属和层次关系为排列顺序的一种代码,优点是能明确表示出分类对象的类别,代码结构有严格的隶属关系。,常用的编码分类方法,是指对于一个特定的分类目标,根据诸多不同的分类依据分别进行编码,各个数字之间并没隶属关系。,(2)多源分类编码法(独立分类编码),常年河,通航,主流长15KM,宽60m,平均深度为70m,可表示为?,(一)图形数据编辑(二)属性数据编辑,第三节 空间数据的编辑与处理,(一)图形数据编辑,图形编辑又叫数据编辑、数字化编辑,是指对地图资料数字化后的
15、数据进行编辑加工,其主要的目的是在改正数据差错的同时,相应地改正数字化资料的图形。数据编辑是数据处理的主要环节,并贯穿于整个数据采集与处理过程。,空间数据编辑的必要性修正数据输入错误维护数据的完整性和一致性更新地理信息空间数据一般性错误数据不完整、重复空间数据位置不正确空间数据比例尺不准确空间数据变形几何和属性连接有误属性数据不完整,空间数据的编辑与处理,误差修正一般过程:设定容许值连接接点重建拓扑关系,空间数据的编辑与处理,(1)伪节点(Pseudo Node):当一条线没有一次录入完毕时,就会产生伪结点。(2)悬挂节点(Dangling Node):当一个节点只与一条线相连接,那么该节点称
16、为悬挂节点。有过头和不及、多边形不封闭、节点不重合等几种情形。(3)碎屑多边形(Sliver Polygon):也称条带多边形。因为前后两次录入同一条线的位置不可能完全一致,就会产生碎屑多边形,即由于重复录入而引起。(4)不正规的多边形(Weird Polygon):在输入线的过程中,点的次序倒置或者位置不准确会引起不正规的多边形。,1、常见的数字化的误差,1、属性数据校核包括两部分:(1)属性数据与空间数据是否正确关联,标识码是否唯一,不含空值。(2)属性数据是否准确,属性数据的值是否超过其取值范围等。2、属性数据错误检查可通过以下方法完成:(1)首先可以利用逻辑检查,检查属性数据的值是否超
17、过其取值范围,属性数据之间或属性数据与地理实体之间是否有荒谬的组合。(2)把属性数据打印出来进行人工校对,这和用校核图来检查空间数据准确性相似。,(二)属性数据编辑,其它图形数据错误,包括遗漏某些实体、重复录入某些实体、图形定位错误等的检查一般可采用如下方法进行:(1)叠合比较法,把成果数据打印在透明材料上,然后与原图叠合在一起,在透光桌上仔细的观察和比较。叠合比较法是空间数据数字化正确与否的最佳检核方法,对于空间数据的比例尺不准确和空间数据的变形马上就可以观察出来。(2)目视检查法,指在屏幕上用目视检查的方法,检查一些明显的数字化误差与错误。(3)逻辑检查法,根据数据拓扑一致性进行检验,如将
18、弧段连成多边形,数字化节点误差的检查等。,3、图形数据的检查,1、几何纠正2、坐标变换3、栅格数据重采样,(三)空间数据变换,1、几何纠正 由于如下原因,使扫描得到的地形图数据和遥感数据存在变形,必须加以纠正。(1)地形图的实际尺寸发生变形;(2)在扫描过程中,工作人员的操作会产生一定的误差;(3)遥感影像本身就存在着几何变形;(4)地图图幅的投影与其它资料的投影不同;(5)扫描时受扫描仪幅面大小的影响,有时需将一幅地形图或遥感影像分成几块扫描,这样会使地形图或遥感影像在拼接时难以保证精度。,四点纠正法逐网格纠正法,(1)地形图的纠正,遥感影像的纠正,一般选用和遥感影像比例尺相近的地形图或正射
19、影像图作为变换标准,选用合适的变换函数,分别在要纠正的遥感影像和标准地形图或正射影像图上采集同名地物点。,(2)遥感影像的纠正,是利用数字高程模型对扫描数字化的(或直接以数字方式获取的)航空像片(或航天影像),经过数字微分纠正、数字镶嵌,按国家基本比例尺地形图图幅范围剪裁生成的数字正射影像数据集。它是同时具有地图几何精度和影像特征的图像,具有精度高、信息丰富、直观真实等优点。,DOM-Digital Orthophoto Map 数字正射影像图,具体采点时,要先采源点(影像),后采目标点(地形图)。选点时,要注意选点的均匀分布,点不能太多。如果在选点时没有注意点位的分布或点太多,这样不但不能保
20、证精度,反而会使影像产生变形。点位应选由人工建筑构成的并且不会移动的地物点,如渠或道路交叉点、桥梁等,尽量不要选河床易变动的河流交叉点,以免点的移位影响配准精度。,坐标变换的实质:是建立两个空间参考系之间点的一一对应关系,将地理数据统一到同一空间参考系下。,2、坐标变换,(1)投影变换,投影变换必须已知变换前后的两个空间参考的投影参数,然后利用投影公式的正解和反解算法,推算变化前后两个空间参考系之间点的一一对应函数关系。投影变换是坐标变换中精度最高的变换方法。,(1)反解变换法(又称间接变换法),假定原图点的坐标为x,y(称为旧坐标),新图点的坐标为X,Y(称为新坐标),则由旧坐标变换为新坐标
21、的基本方程式为:,(2)正解变换法(又称直接变换法),利用若干同名数字化点(对同一点在两种投影中均已知其坐标的点),采用插值法、有限差分法或多项式逼近的方法,即用数值变换法来建立两投影间的变换关系式。例如,采用二元三次多项式进行变换:,(3)数值变换法,(2)仿射变换,直线变换后仍为直线;平行线变换后仍为平行线;不同方向上的长度比发生变化。,仿射变换是在不同的方向上进行不同的压缩和扩张,可以将球变为椭球,将正方形变为平行四边形。,(3)相似变换,相似变换是由一个图形变换为另一个图形,在改变的过程中保持形状不变(大小可以改变)。在二维坐标变换过程中,经常遇到的是平移、旋转和缩放三种基本的相似变换
22、操作。,(2)旋转 在地图投影变换中,经常要应用旋转操作,实现旋转操作要用到三角函数,假定顺时针旋转角度为,其公式为:,(1)平移 平移是将图形的一部分或者整体移动到笛卡尔坐标系中另外的位置,其变换公式为:,(3)缩放 操作可用于输出大小不同的图形,其公 式为:,(4)橡皮拉伸,橡皮拉伸通过坐标几何纠正来修正缺陷。主要针对几何变形,通常发生在原图上。它们可能由于在地图编绘中的配准缺陷、缺乏大地控制或其它各种原因产生。,3、栅格数据重采样,在处理栅格数据时,常常要进重采样操作,原因是原先数据的栅格大小不符合我们的要求,或者在进行栅格数据配准后,像元发生倾斜,通过重采样操作可以让栅格数据的像元重新
23、变得规则。,最邻近像元法(Nearest)双线性内插(Bilinear)双三次卷积法(Cubic),I(P)=I(N)xN=INT(x+0.5)yN=INT(y+0.5),(1)最邻近像元法,(2)双线性多项式插值法,(3)双三次卷积法,数据重构,数据结构转换,数据格式转换,外部数据交换模式,直接数据访问模式,数据互操作模式,空间数据共享平台,矢量转栅格,栅格转矢量,四、数据重构,(一)数据结构转换,1、矢量转栅格,令矢量数据的直角坐标X和Y分别与栅格数据的行和列平行。,点的栅格化:,线的栅格化bresenham算法,(一)数据结构转换,2、栅格转矢量,从图幅西北角开始,按顺时针或逆时针方向,
24、从起始点 开始,根据八个邻域进行搜索,依次跟踪相邻点,找出 线段经过的栅格;将栅格(i,j)坐标变成直角坐标(X,Y);生成拓扑关系;去除多余点及曲线圆滑.,矢量化的过程:,空间数据、属性数据、拓扑信息、元数据和数据描述信息,数据转换的分类:,(1)分层和编码原则都不同的数据转换。(2)分层不同,编码原则相同的数据转换。(3)分层相同,编码方案完全一致的数据转换。,(二)数据格式转换,实现数据交换的模式:(1)外部数据交换模式(2)直接数据访问模式(3)标准空间数据交换标准(4)空间数据的互操作方式,三次转换,二次转换,1、外部数据交换方式,是目前空间数据转换的主要方式。大部分商用GIS软件定
25、义了外部数据交换文件格式,一般为ASCII码文件,如ArcInfo的EOO,MapInfo的MID,AutoCAD的DXF等。,交换,交换,不同系统间的数据转换:,是指在一个GIS软件中实现对其他软件数据格式的直接访问,用户可以使用单个GIS软件存取多种数据格式。,直接数据访问提供了一种更为经济实用的多源数据共享模式,但同样要建立在对被访问的数据格式和数据模型有充分了解的基础上,如果被访问的数据格式不公开,就要保证破译正确,才能与该格式的宿主软件实现数据共享。如果数据格式发生变化,各数据集成软件不得不重新研究该宿主软件数据格式,提供升级版本,导致数据集成软件对于不同格式的地理信息处理必定存在滞
26、后性。,2、直接数据访问方式,直接数据访问不仅避免了繁琐的数据转换,而且在一个GIS软件中访问某种软件的数据格式不再要求用户拥有该数据格式的宿主软件,更不需要运行该软件。,GeoMedia 实现了对大多数GIS/CAD 软件数据格式的直接访问,包括:MGE、Arc/Info、Frame、Oracle Spatial、SQL Server、Access MDB 等。SuperMap 提供的直接访问数据引擎包括:SDB 文件引擎、SDX 系列空间数据库引擎、MDB 引擎、DGN 引擎、DWG 引擎、SDE引擎等。,目前使用直接数据访问模式实现多源数据集成的GIS 软件主要有两个,即:Intergr
27、aph 推出的GeoMedia 系列软件国产SuperMap。,这种方式是采用一种空间数据的转换标准来实现空间数据格式转换,尽量减少空间数据格式交换造成的信息损失,使之更加科学化与标准化。,3、标准空间数据交换标准方式,转换,转换,美国国家空间数据协会(NSDI,National Spatial Data Institute)制定了统一的空间数据格式规范SDTS.我国的空间数据交换格式(CNSDTF)包括几何坐标、投影、拓扑关系、属性数据、数据字典,也包括栅格和矢量等不同空间数据格式的转换标准。根据STDS,目前有许多GIS软件提供了标准的空间数据交换格式,如ArcInfo的STDSIMPOR
28、T和STDSEXPORT模块等,可供其他系统调用。有了空间数据交换的标准格式后,每个系统都提供读写这一标准格式空间数据的程序,避免了大量的编程工作,而且数据转换只需两次。,空间数据的互操作方式是基于公共接口的数据融合方式。接口相当于一种规程,它是大家都遵守并达成统一的标准。,4、空间数据的互操作方式,OGC(Open GIS Consortium)为数据互操作制定了统一的规范,从而使一个系统同时支持不同的空间数据格式成为可能。OpenGIS的思想是将空间数据的转换变成一次转换或者不进行转换,实现不同GIS软件系统之间空间数据的互操作。,图幅拼接就是在两幅相邻地图的边界上,由于某种原因造成跨图幅
29、同一要素几何位置偏差,在编辑修改时,用手工或自动的方法将相邻图幅的同名要素拼接在一起,从而达到修正误差的目的。,五、图幅的拼接,(一)图幅拼接的概念,平均法:平均法是取图边两边待接点的坐标均值作为接边后的点的坐标。,(二)图幅拼接的原理,(三)图幅拼接步骤,(1)逻辑一致性的处理(2)识别和检索相邻图幅(3)相邻图幅边界点坐标数据的匹配(4)相同属性多边形公共边界的删除,由于人工操作的失误,两个相邻图幅的空间数据库在接合处可能出现逻辑裂隙,如一个多边形在一幅图层中具有属性A,而在另一幅图层中属性为B。此时,必须使用交互编辑的方法,使两相邻图斑的属性相同,取得逻辑一致性。,(1)逻辑一致性的处理
30、,将待拼接的图幅数据按图幅进行编号,编号有2位,其中十位数指示图幅的横向顺序,个位数指示纵向顺序,并记录图幅的长宽标准尺寸。,(2)识别和检索相邻图幅,只要符合下列条件,两条线段或弧段即可匹配衔接:相邻图幅边界两条线段或弧段的左右多边形码各自相同或相反;相邻图幅同名边界点坐标在某一允许值范围内(如土0.5mm)。,(3)相邻图幅边界点坐标数据的匹配 追踪拼接法,当图幅内图形数据完成拼接后,相邻图斑会有相同属性。此时,应将相同属性的两个或多个相邻图斑组合成一个图斑,即消除公共边界,并对共同属性进行合并。,4 相同属性多边形公共边界的删除,(一)点线拓扑关系的建立(二)多边形拓扑关系的建立(三)网
31、络拓扑关系的建立,六、拓扑生成,(一)点线拓扑关系的建立,结点-弧段表,弧段-结点表,1、在图形采集和编辑中实时建立,2 在图形采集和编辑之后自动建立。,结点-弧段表,弧段-结点表,(二)多边形拓扑关系的建立,独立多边形具有公共边界的简单多边形嵌套的多边形复合多边形,1 多边形有四种情况:,2 多边形生成的步骤,以任一弧段的端点为圆心,以给定容差为半径,产生一个搜索圆,搜索落入该搜索圆内的其他弧段的端点,若有,则取这些端点坐标的平均值作为结点位置,并代替原来各弧段的端点坐标。,节点匹配,在结点匹配的基础上,对产生的结点进行编号,并产生两个文件表,一个记录结点所关联的弧段,另一个记录弧段两端的结
32、点。,建立节点-弧段拓扑关系,结点-弧段表,弧段-结点表,多边形的自动生成实际上就是建立多边形与弧段的关系,并将弧段关联的左右多边形填入弧段文件中。,多边形自动生成,从弧段文件中得到第一条弧段,以该弧段为起始弧段,并以顺时针方向为搜索方向,若起终点号相同,则这是一条单封闭弧段。否则根据前进方向的节点号在节点弧段拓扑关系表中搜索下一个待连接的弧段。,建立多边形拓扑关系的算法,结点-弧段表,弧段-结点表,P1,(三)网状拓扑关系的建立,在输入道路、水系、管网、通讯线路等信息时,为了进行流量、连通性、最佳线路分析,需要确定实体间的连接关系。网络拓扑关系的建立主要是确定结点弧段之间的拓扑关系。但在一些
33、特殊情况下,两条相互交叉的弧段在交点处不一定需要结点,如道路交通中的立交桥,在平面上相交,但实际上不连通,这时需要手工修改,将在交叉处连通的节点删除。,七、数据压缩,节省存贮空间节省处理时间,(一)数据压缩的目的(二)数据压缩的途径(三)常用空间数据压缩方法,(二)数据压缩途径,压缩软件:原数据信息基本不丢失而且可以大大节省存贮空间,缺点是压缩后的文件必须在解压缩后才能使用;数据消冗处理:原数据信息不会丢失,得到的文件可以直接使用,缺点是技术要求高,工作量大,对冗余度不大的数据集合效用小;用数据子集代替数据全集:在规定的精度范围内,从原数据集合中抽取一个子集,缺点以信息损失为代价,换取空间数据
34、容量的缩小。,(三)常用空间数据压缩方法,1、栅格数据的压缩2、矢量数据的压缩,矢量数据压缩的目的是删除冗余数据,减少数据的存储量,节省存储空间,加快后继处理的速度。压缩的主要任务是根据线性要素中心轴线和面状要素的边界线的特征,减少弧段矢量坐标串中顶点的个数。,(1)间隔取点法(2)垂距法和偏角法(3)分裂法,常用的矢量数据压缩方法:,每隔规定的距离取一点,或者每隔k个点取一点,但首末点一定要保留。如图所示,弧段由顶点序列P1,P2,Pn构成,D临为临界距离。首先保留弧段的起始点P1,再计算P2点与 P1点之间的距离D21,若D21D临,则保留第P2点,否则舍去P2点。依此方法,逐一比较相邻两
35、点间的距离,以确定需要舍弃的点。,(1)间隔取点法,(2)垂距法和偏角法,这两种方法是按照垂距或偏角的限差选取符合或超过限差的点。P2点的垂距和偏角小于限差,应舍弃;P3点的垂距和偏角大于限差,应保留。,(3)分裂法,这种方法试图保持曲线走向,并允许用户规定合理的限差。其步骤为:把曲线首末两端点连成一条直线;计算曲线上每一点与直线的垂直距离。若所有这些距离均小于限差,则将直线两端点间的各点全部舍去。若上一步条件不满足,则保留含有最大垂足距离的点,将原曲线分成两段曲线,再递归地重复使用分裂法。,(一)空间数据质量的概念(二)空间数据质量评价(三)空间数据的误差分析(四)空间数据质量的控制,第四节
36、 数据质量评价与控制,(一)空间数据质量的概念,现实世界的复杂性和模糊性,以及人类认识和表达能力的局限性,这种抽象表达总是不可能完全达到真值的,而只能在一定程度上接近真值。对空间数据的处理也会导致出现一定的质量问题。,1、空间数据质量,空间数据的三要素:,空间位置、属性特征、时间。,空间数据是有关空间位置、专题特征以及时间信息的符号记录。,空间数据质量是空间数据在表达三要素时,所能确达到的一致性、准确性、完整性以及三者之间统一性的程度。,数据质量产生的原因:,(1)误差(Error):误差表示测量值与其真值之间的差异。(2)偏差(bias):测量值与平均值之差。(3)准确度(Accuracy)
37、:准确度是量测值与真值之间的接近程度。(4)精密度(Precision):精密度指在对某个量的多次量测中,各量测值之间的离散程度。(5)不确定性(uncertainty):不确定性是指对真值的认知或肯定的程度,是更广泛意义上的误差.包含系统误差、偶然误差、粗差、可度量和不可度量误差、数据的不完整性、概念的模糊性等。,2 与数据质量相关的几个概念,精密度与准确度的关系:,1、空间数据质量标准 数据质量是数据整体性能的综合体现。空间数据质量标准是生产、使用和评价空间数据的依据.,(二)空间数据质量评价,(1)完备性:要素、要素属性和要素关系的存在和缺失。(2)逻辑一致性:对数据结构、属性及关系的逻
38、辑规则的依附度。(3)位置准确度:要素位置的准确度。(4)时间准确度:要素时间属性和时间关系的准确度。(5)专题准确度:定量属性的准确度;定性属性的正确性;要素的分类分级以及其他关系。,(1)直接评价法:对数据集通过全面检测或抽样检测方式进行评价的方法,又称验收度量。(2)间接评价法:对数据的来源和质量、生产方法等间接信息进行数据集质量评价的方法,又称预估度量。,2、评价方法,1 空间数据的误差源2 误差产生的主要原因3 误差类型分析,(三)空间数据的误差分析,1 空间数据的误差源,2 误差产生的主要原因,(1)几何误差(2)属性误差(3)时间误差(4)逻辑误差,3 误差类型分析,(2)属性误
39、差,(3)时间误差,属性错误,属性数据可分为命名量、次序量、间隔量和比值量4个层次。,(4)逻辑误差,空间数据质量控制是指在GIS建设和应用过程中,对可能引入误差的步骤和过程加以控制,对这些步骤和过程的一些指标和参数予以规定,对检查出的错误和误差进行修正,以达到提高系统数据质量和应用水平的目的。,(四)空间数据质量的控制,传统的手工方法 元数据方法 地理相关法,1 空间数据质量控制方法,以地图数字化生成空间数据过程为例:(1)数据源的选择(2)数字化过程的数据质量控制,2 空间数据生产过程中的质量控制,(五)数据入库,空间数据库建库就是经过一系列的转换,对采集和处理后的成果数据进行统一的组织和管理。,数据入库流程图,(一)数据入库流程,思考题空间数据采集方法有哪些?它们分别适合采集什么样的数据?说说在数字化中属性数据采集的原则和方法?为什么要对数字化地图进行编辑与处理后才能入GIS数据库?GIS数据精度可以从哪几个方面进行评价?并解释。,
链接地址:https://www.31ppt.com/p-5296880.html