地理信息系统数据采集与处理.ppt
GIS原理(四)第四章 地理信息系统数据 采集与处理,主讲教师:邱春霞测绘学院,重点内容,GIS的数据来源空间数据的处理内容及流程空间索引的概念与类型空间数据的质量控制,地理空间数据是GIS的处理对象,空间数据的数量与质量在很大程度上决定了GIS的价值。也就是说,空间数据源、空间数据的采集手段、生产工艺、数据质量都直接影响着GIS应用的潜力、成本和效率。空间数据在GIS中具有非常重要的意义。,第一节 空间数据的采集,GIS的空间数据是多源数据(图形图 像数据、文字符号数据、多媒体数据),一、GIS数据源,(一)图形图像数据 地图数据:普通地图、专题地图 影像数据:卫星遥感影像、航空影像 地形数据:地形图、实测地形数据、DEM 测量数据及GPS数据,地图数据,卫星遥感影像,ADS40数字航空影像,DEM产品,(二)文字符号数据文字符号数据:是以数字、文字、符号表示的数据,包括空间要素数据和测量数据,统计数据,调查数据,各种法律文档数据,社会经济数据,元数据等各种形式的电子数据。,(三)多媒体数据多媒体数据:是指音频数据和视频数据。,音频文件的格式:CD、MIDI、WAVE、.MP1/.MP2/.MP3、.MP4、.VQF、.AIF/AIFF、.AU、.RA/RM/RAM,视频文件的格式:影像格式和流格式 影像格式有:AVI、MPEG、DivX、MOV、WMV 流格式有:RM/RA、ASF、MOV,GIS的不同数据源及种类,二、空间数据的尺度,人们在观察、认识自然现象、自然过程以及各种社会经济问题时,如果尺度不同、角度不同、分辨率不同,将得到不同的印象、认识或结果。因此,选择恰当的空间尺度是非常重要的。,(一)考虑空间尺度的重要性,(二)空间尺度的概念和表达方式,尺度:是指研究者选择观察(测)世界的窗口。不同学科、不同研究领域对尺度的表述方式和含义是不同的:比例尺(测绘学、地图制图学、地理学)测量工具、滤波器(数学、机械学、光学等)空间分辨率(航空摄影、遥感技术),三、属性数据的获取与输入,属性数据:即空间实体的特征数据,主要定义空间数据或制图特征所表示的内容,一般包括名称、等级、数量、代码等多种形式。空间点、线、面实体都有相应的属性。属性数据源 遥感数据、各种统计数据、现场调查资料、社会调查资料、其他资料等。,在建立GIS前,首先要进行详细的用户调查,确定需要存储哪些属性信息,属性数据的编码方法及信息的来源等。,(一)属性数据的编码原则,编码的系统性和科学性编码的一致性编码的标准化和通用性编码的简洁性编码的可扩展性,(二)编码内容,登记部分分类部分控制部分,(三)编码方法,列出全部制图对象清单;制定对象分类、分级原则和指标将制图对象进行分类、分级;拟定分类代码系统;设定代码及其格式;建立代码和编码对象的对照表。,常用的编码方法:层次分类编码法 多源分类编码法,层次分类编码法:是按照分类对象的从属和层次关系为排列顺序的一种代码,它的优点是能明确表示出分类对象的类别,代码结构有严格的隶属关系。如,土地利用现状分类编码。多源分类编码法:又称独立分类编码法,是指对于一个特定的分类目标,根据诸多不同的分类依据分别进行编码,各位数字代码之间并没有隶属关系。它的优点是具有较大的信息载负量,有利于对空间信息的综合分析。,(四)属性数据的输入,输入方式有两种:对照图形直接输入(属性数据量较小时)建立属性表输入属性或从其他统计数据库中导入属性,然后根据关键字与图形数据自动连接(属性数据量较大时),点、线、面状地物属性的添加,(五)属性数据的获取 现场专题调查采集样本资料 将局部样本资料和遥感信息对照 社会调查与统计 已有资料,四、几何图形的数据采集与输入,将表示点、线、面实体的地理位置数据通过键盘输入数据文件或输入到程序中,再进行连线编辑。,(一)手工数据输入方法,(二)地图数据的获取 数字化仪数字化(已淘汰)扫描仪获取地图数据,1、扫描仪获取地图数据的种类,栅格型数据屏幕矢量化型数据栅格图向矢量地图的自动转换,2、扫描仪获取地图数据的过程,扫描,栅格数据,自动矢量化,矢量文件,文件转换,GIS数据库,原始图像预处理,栅格编辑,矢量编辑,(三)遥感数据的获取,遥感传感器平台,传感器,遥感(Remote Sensing):从远处探测、感知物体或事物的技术。即不直接接触物体本身,从远处通过各种传感器探测和接收来自目标物体的信息,经过信息的传输及其处理分析,来识别物体的属性及其分布等特征的综合技术。,遥感数据的特点,宏观性、综合性 覆盖范围大、信息丰富。一景TM影像为185185平方公里;影像包含各种地表景观信息,有可见的,也有潜在的。,多时相性重复探测,有利于进行动态分析。,1986,2002,1992,green,red,Near-infra red,多波段性波段的延长使对地球的观测走向了全天候。,遥感数据的获取方式,目视法,遥感图像处理方法,(四)摄影测量数据,各种类型传感器,被摄物体影像,通过量测和解译过程,自然物体及其环境的可靠信息,DEM,DLG,DRG,DOM,摄影测量作业流程,摄影测量发展的三个阶段,模拟摄影测量解析摄影测量数字摄影测量,数字摄影测量,基于摄影测量的基本原理,通过对所获取的数字/数字化影像进行处理,自动(半自动)提取被摄对象用数字方式表达的几何与物理信息,从而获得各种形式的数字产品和目视化产品,计算机技术数字图像处理影像匹配模式识别DPW,Virtuo-Zo 数字摄影测量系统,JX-4C数字摄影测量工作站,数字摄影测量获取数据的过程,航空摄影,航片,航片扫描,数字化影像,数码相机,数字影像,定向建模,矢量测图,图形编辑,数字地形图,外业调绘,像片控制,空三加密,内定向相对定向绝对定向,满足GIS,五、数据的检核,空间数据的不完整或重复;空间数据的位置不正确;空间数据的比例尺不准确;空间数据的变形;图形数据与属性数据连接有误;属性数据不完整。,(一)空间和属性数据的错误和误差的类型,几种典型的空间数据采集错误和误差形式,(二)数据检核的方法,目标检核;机器检核;图形叠合比较法;属性数据检核。,第二节 空间数据的处理,坐标转换是将图形从一种坐标系转换为另一种坐标系,坐标转换一般包括平移、旋转、缩放。,一、坐标转换,(一)平移,平移:是将图形的一部分或者整体移动到笛卡儿坐标系的另外位置。变换公式为:,(二)缩放,缩放操作可以用于输出大小不同的图形。变换公式为:,(三)旋转,设顺时针旋转角度为,则变换公式为:,综合考虑图形的平移、旋转、缩放,则坐标变换公式为:上式是一个正交变换,其更一般的形式为:上式为二维的仿射变换。,二、数据格式转换,利用数字化仪、扫描仪等方法输入的数据往往先存入临时数据文件,经过适当转换后才进入正式的数据库中。从外部数据文件获得的数据在数据结构、数据组织、数据表达上和用户自己的信息系统往往不一致,需要进行转换。,(一)数据格式转换的原因,(二)空间数据转换的内容,空间定位信息,即实体的坐标;空间拓扑关系;属性信息。,一般情况下,空间定位信息能够完整地进行转换;拓扑关系在转换过程中经常丢失,若数据模型基本一致,拓扑关系信息在转换过程中丢失后,可以在数据转换后的系统中进行重构而得以恢复;属性数据在大部分GIS软件中都能够进行转换。,(三)空间数据格式转换的途径,外部数据交换方式标准空间数据交换格式空间数据互操作方式空间数据的直接访问空间数据共享平台,1、外部数据交换方式,大部分商用GIS软件都定义了外部数据交换格式,一般为ASCII码文件,可以直接阅读。如ArcGIS的e00文件、MapInfo的MID/MIF文件、ArcView 的shape格式、AutoCAD的DXF格式;MGE的ArcII Loader格式。利用外部数据交换方式从系统A的内部数据转换到系统B,可能需要经过23次转换。,系统A内部文件,系统A外部交换文件,系统B外部交换文件,系统B内部文件,二次转换,交换,交换,三次转换,若将AutoCAD数据格式转为MAPGIS数据格式,采用外部数据交换方式如何转换?,例,将Mapinfo的tab格式转换为Arcinfo的Coverage格式。Mapinfo的tab ArcinfoE00/AutoCAD的DXF Arcinfo的Coverage,方法特点,优点:容易接受。缺点:耗费人力、物力;易造成数据丢失和信息(拓扑关 系)丢失。,2、标准空间数据交换格式,GIS数据格式A,标准空间数据交换文件,GIS数据格式B,每个GIS系统只需读写标准格式空间数据程序,用二次转换完成数据交换。,方法特点,各个GIS系统不必公开内部数据格式,只需公开转换技术;制定转换标准的难度非常大;在一定程度上克服了空间数据的外部数据交换模式缺乏对空间对象统一的描述方法的缺点。,目前已有的空间数据交换标准,美国的STDS、欧洲的GDF、中国的CNSDTS目前的空间数据交换标准还不完善。,3、空间数据互操作方式,空间数据互操作方式:是通过公共接口实现不同系统间不同数据结构、不同数据格式的数据动态调用,这个公共接口相当于一个规程。,Open GIS互操作规范,Open GIS互操作规范:是开放式GIS协会提出的一个为了提供地理数据和地理操作的交互性和开放性的软件开发规范。,通过OpenGIS的空间数据交换,OpenGIS提供了一套读取空间数据的标准函数,每个系统软件都按照这一标准提供读写自己系统中空间数据的驱动程序,其他软件都可以通过调用这一程序,直接读取对方的内部数据。,系统A内部文件标准API函数,标准API函数系统B内部函数,OGIS与传统GIS处理技术的比较,OGIS独立于具体的平台,转换技术高度抽象,数据格式不需公开,它允许用户通过网络实时获取不同系统中的地理信息,它将提供数据源的软件叫数据服务器,将使用数据源的软件叫数据客户器,当数据客户器要使用某数据源时,发出数据请求,由数据服务器提供服务。现状:Open GIS互操作规范已引起广泛关注,将成为国际标准,但目前还没有一个商业软件完全实现OGIS的操作规范。,4、空间数据的直接访问,空间数据的直接访问:是指在一个GIS中实现对其他GIS软件数据格式的直接访问。,方法特点,优点:避免了繁琐的数据转换;一个GIS系统访问另一个系统的数据格式时,不 必拥有该系统的宿主软件。缺点:在充分了解不同格式的基础上,才能直接进 行数据访问,工作比较被动;如果对方数据格式不公开,就无法直接访问它;如果宿主软件的数据格式进行升级、更新,直接访问的软件必须作相应的变更。,现状,Intergraph公司的Geomedia系列软件提供了空间数据的直接访问支持。,5、空间数据共享平台,空间数据共享平台:是指空间数据及各个应用软件共享平台,它把数据存储在服务器上,用户通过客户端程序经共享平台访问服务器上的数据,解决了数据的一致性问题,即当某一应用程序对数据进行修改后,能直接反映到数据库中。,方法特点,理论上最好的空间数据共享平台;实际实施时有一定难度(因为各GIS厂商都不会轻易放弃自己开发的底层系统。,三、投影转换,地理空间数据为多源数据,在GIS中进行某些操作或处理时(如叠置分析),要求所有空间信息层必须是同种投影。因此,需要将一种投影的数据转换为所需投影的坐标数据。,投影转换的三种途径,直接转换间接转换数值变换,(一)直接转换,通过建立一种投影变换为另一种投影的严密或近似的解析关系式,直接由一种投影的数字化坐标(x,y)变换为另一种投影的直角坐标(X,Y)。(x,y)(X,Y)对于不同投影系统,很难找到这种解析关系式。,(二)间接变换,利用坐标反算公式,将一种投影的平面坐标换算为球面大地坐标;使用坐标正算公式把球面大地坐标代入另一种投影的坐标公式中,计算出该投影下的投影坐标。,(x,y)(B,L)(X,Y),坐标反算,坐标正算,高斯换带,将一个带的高斯平面直角坐标转换为大地坐标;将大地坐标转换为另一相邻带的高斯平面直角坐标。,(X1,Y1),(B,L),(X2,Y2),坐标反算,坐标正算,(三)数值变换,根据两种投影在变换区内的已知坐标的若干同名控制点,采用插值法或有限差分法、有限元法、待定系数最小二乘法,实现两种投影坐标之间的变换。变换公式为:,四、空间数据压缩处理,数据压缩:是从取得的数据集合中抽出一个子集,这个子集作为一个新的信息源,在规定的精度范围内最好地逼近原集合,而又取得尽可能大的压缩比。矢量数据压缩的主要任务是:根据线性要素中心轴线和面状要素的边界线的特征,减少弧段矢量坐标串中顶点的个数(结点不能去除)。,矢量数据压缩方法有:,间隔取点法垂距法和偏角法DouglasPeucker方法,(一)间隔取点法,设弧段由顶点P1、P2、Pn组成,则任意两点m、n间的距离为:当给定临界点距离为D时,若DmnD,则保留m点,否则舍去m点。依次类推,逐一比较。注意:弧段的起点、终点必须保留。,间隔取点法曲线压缩取点示意图,间隔取点法可大量减少弧段顶点序列中点的个数,但不一定能恰当地保留弧段曲线的大弯曲变化部分。,(二)垂距法和偏角法,垂距法和偏角法:是按垂距或偏角的限差选取符合或超过限差的点,即利用曲线点序列中顺序的3点Pn-1、Pn、Pn+1,把Pn-1与Pn+1点相连,计算Pn点到Pn-1 Pn+1连线的垂距(垂距法)或计算Pn-1 Pn与Pn-1 Pn+1直线的夹角(偏角法),并与规定的限差比较,以确定Pn点的取舍。,按垂距法和偏角法对曲线进行压缩的过程,垂距法和偏角法虽然不能同时考虑相邻点间的方向和距离,且有可能舍去不该舍去的点,但比间隔取点法好。,(三)DouglasPeucker方法,把一条曲线首末两点连成一条直线;计算出各点到该直线的距离;选取距离中最大者与规定限差比较,若大于限差,则离该直线距离最大的点保留,否则将直线两端点间各点全部舍去;,图中4号点应该保留 将已知点列分成两部分处理,计算2、3点到1、4点连线的距离,选距离大者与限差比较,结果2、3点均舍去;计算5点到4、6两点连线的距离,经比较,应保留;依此类推,最后保留的点在原数据库中的编号为1、4、5、6点,重新排序后得到经压缩后的点序为1、2、3、4。,DouglasPeucker法试图保持曲线走向,并允许用户规定合理的限差。相对于上两种方法,DouglasPeucker法较好。,五、图幅拼接,主要是因为数字化误差而引起的。分为:几何接边 逻辑接边,1、几何接边,几何接边:主要是对图廓边附近的线段进行接边。方法:自动接边(给出容差,对线段进行自动吻合。人工方式,2、逻辑接边,主要是人工操作的错误而引起的,使相邻两幅图同一图形要素的属性不一致。逻辑接边包括:将相邻图幅上同一目标连在一起时,将属性数据逻辑上连成一体;将相邻图幅上同一目标的图形编码值和属性值不一致时,实现一致。方法:通过关键字在相邻图幅上找同一目标,再结合人工编辑解决;在图幅文件上建立一个新的索引文件,以指向各图幅文件的子目标。,六、拓扑关系生成,拓扑关系的生成是GIS项目中的关键;建立拓扑关系时,只需要关注实体之间的邻接、关联和包含关系;本节以链状双重独立编码为例,介绍多边形和网络拓扑关系的建立过程。,(一)多边形拓扑关系的建立,独立多边形具有公共边界的简单多边形嵌套多边形,1、多边形的三种情况:,2、多边形自动生成的步骤和方法(以具有公共边界的简单多边形为例),以任一弧段的端点为圆心,以给定容差为半径,产生一个搜索圆,搜索落入该搜索圆的其他弧段的端点,若有,则取这些端点坐标的平均值作为结点的位置,并代替原来各弧段的端点坐标。,结点匹配,建立结点弧段拓扑关系,结点匹配后,再对产生的结点进行编号,并产生两个文件表,一个记录结点所关联的弧段,一个记录弧段两端的结点。,多边形的自动生成,多边形的自动生成实际上就是建立多边形与弧段的关系,并将弧段关联的左右多边形填入弧段文件中。建立多边形拓扑关系时,弧段是有方向性的,与其关联的两个多边形为左多边形和由多边形。,将所有弧段的左、右多边形置空,并将已建立的结点弧段拓扑关系中各个结点所关联的弧段按方位角大小排序。方位角:是从x轴按逆时针方向量至结点与它相邻的该弧段上后一个(或前一个)顶点的连线的夹角。,建立多边形拓扑关系的算法,在弧段文件中得到第一条弧段,其为起始弧段;以顺时针方向为搜索方向,搜索该弧段的后续弧段;直到搜索到弧段追踪的起点,则形成一个弧段号顺时针排列的闭合多边形,该多边形弧段的拓扑关系表建立,然后将形成的多边形号填入弧段多边形关系表的左、右多边形内。,注意:从起始弧段搜索后续弧段时,若起终点号相同,则搜索的弧段为一条单封闭弧段。与每个结点有关的弧段都已按方位角大小排序,下一个待连接的弧段就是该弧段的后续弧段。,若起始弧段为A4,起结点为N4,终结点为N3如何搜索后续弧段?,对于嵌套多边形,需要在建立简单多边形以后或建立过程中,采用多边形包含分析方法判别一个多边形包含了哪些多边形,并将这些内多边形按逆时针排列。,(二)网络拓扑关系的建立,网络拓扑关系的建立,主要是确定结点与弧段之间的拓扑关系。由GIS软件自动完成。建立方法与建立多边形拓扑关系相似,不同之处在于不需建立多边形。,第三节 空间索引,GIS的空间数据库是用来存储和管理各种空间或非空间数据的计算机应用系统。空间数据库不仅要对非空间数据做索引,而且要对空间数据做很好的索引,以提高各种空间操作的效率。,一、概念,空间索引:是依据空间对象的位置、形状或空间对象间的某种空间关系,按一定的顺序排列的一种数据文件,其中包含空间实体的概要信息,如实体的标识符、外接矩形及指向空间实体的指针。,二、空间索引的主要目的,空间索引作为一种辅助性的空间数据结构,介于空间操作算法和空间实体之间。主要目的:在进行空间操作时,通过对空间数据的筛选和过滤,把大量与之无关的空间数据预先排除,从而提高空间操作的效率。空间索引是一项非常关键的技术,它的性能直接影响着空间数据库和GIS系统的整体性能。,三、空间索引的常用类型,实体范围索引格网索引四叉树索引BSP树索引KDB树索引R树索引R+树索引CELL树索引,(一)实体范围索引,实体范围索引:是在记录每个空间实体的坐标时,记录包围每个空间实体的外接矩形的最大最小坐标。当检索实体时,根据空间实体的最大最小范围,预先排除那些没有落入检索窗口内的空间实体,仅对那些外接矩形落在检索窗口内的空间实体作进一步的判断,最后检索出那些真正落入窗口内的空间实体。,基于实体范围的空间数据检索,特点:没有建立真正的空间索引文件,是在存储空间实体的数据文件中增加了外接矩形的最大和最小坐标,主要依靠空间计算来判别。,(二)格网索引,格网索引:是将覆盖整个研究区域的范围按照一定的规则划分成大小相等的格网,然后记录每个格网内所包含的空间实体。在检索空间实体时,将每个格网按Morton码或称Peano码进行编码,建立Peano码与空间实体的关系,该关系表即为格网索引文件。,Peano码编码模型,基于Peano码的格网空间索引,本例中的多边形索引可能有问题?,特点:没有包含空间实体的格网,在索引表中不出现该编码,即没有该条记录;一个格网中包含多个空间实体,需要记录多个实体的标识,容易造成数据冗余;划分格网的数目不能太多,否则,索引表本身太大,不利于数据的索引和检索。,(三)四叉树空间索引,四叉树空间索引:是根据所有空间对象覆盖的范围,进行四叉树分割,使每个子块中包含单个实体,然后根据每个实体的子块层数或子块大小,建立相应的索引。四叉树中的线性四叉树和层次四叉树都可以建立空间索引。,线性四叉树采用十进制Morton码或Peano码来表示四叉树的大小和层数。,根据Peano码和边长值进行空间数据的检索和提取。,使用层次四叉树建立空间数据索引的方法与线性四叉树相同,只是它需要记录不同层次节点的指针,建立索引和维护都比较困难。,(四)R树与R+树空间索引,R树和R+树空间索引:是通过设计虚拟矩形目标,将空间目标包含在相关的矩形(外接矩形、虚拟矩形)内作为空间索引。虚拟矩形的方向与坐标方位轴一致,同时满足:包含尽可能多的空间实体;矩形间的重叠率尽可能少;允许在每个矩形内再划分小矩形;对这些虚拟矩形建立空间索引,它含有指 向所包围的空间实体的指针。,R树空间索引就是按包含实体的矩形来确定的,树的层次表达了分辨率信息,每个实体与R树的结点相联系。矩形的数据结构为:RECT(Rectangle-ID,Type,min-X,min-Y,max-X,max-Y)其中,Rectangle-ID为矩形的标识符;Type为用于表示矩形的类别是实体的外接矩形还是虚拟矩形;min-X、min-Y为该矩形的左下角坐标;max-X、max-Y为该矩形的右上角坐标。,1、R树空间索引,注意:虚拟矩形与实体的外接矩形重合时,两者的标识符相同;由于虚拟矩形允许再划分,必须建立不同层次矩形的相互关系:PS(上层虚拟矩形标识符,下层虚拟矩形标识符),R树空间索引的过程:判断哪些虚拟矩形落入查询窗口内;判别哪些实体是被检索的内容。,R树结构示意图,2、R+树空间索引,R+树空间索引是对R树空间索引的一种改进,它允许虚拟矩形相互重叠,并分割下层虚拟矩形,允许一个空间实体被多个虚拟矩形所包围。R+树空间索引在构造虚拟矩形时,尽量保持每个虚拟矩形包含相同个数的下层虚拟矩形或实体外接矩形,以保证任一实体具有相同的检索时间。,R+树空间索引,R+树空间索引对于被分割的下层虚拟矩形或实体外接矩形,还要增加关系表达:DECOMP(原矩形标识符,分割后矩形1的标识符,分割后矩形2的标识符),R树和R+树空间索引的主要缺点:建立空间索引时,容易受实体方位的限制,当空间数据层发生旋转或投影变换后,矩形区也必须随之重新建立。,(五)CELL空间索引,CELL空间索引克服了R树和R+树的主要缺点。CELL空间索引:是采用凸多边形作为区域划分的基本单元,来对空间数据进行检索。CELL树空间索引是一种优秀的空间数据索引方式(CELL树空间索引检索磁盘访问次数比R树或R+树少),CELL树空间索引,(六)BSP树空间索引,BSP(Binary Space Partition)树采用二叉空间分割。BSP树的基本思想:任何平面都可以将空间分割成两个互不相交的半平面,所有位于这个平面一侧的点定义了一个半空间,位于另一侧的点定义了另一个半平面。构造BSP树的关键是:如何在空间中快速确定分割平面,以使生成的BSP树尽量趋于平衡。,BSP树能很好地与空间数据库中空间对象的分布情况相适应,但对一般情况而言,BSP树深度较大,对各种操作均有不利影响。,BSP树空间索引,第四节 空间数据质量分析与控制,空间数据质量:是指空间数据在表达空间实体或现象的时间信息、空间位置、专题特征等三个基本要素时的准确性、一致性、完整性及三者之间统一性的程度。,一、空间数据质量的概念和内容,准确性(Accuracy):是一个记录值(测量或观察值)与它的真实值之间的接近程度。空间数据的准确性通常是根据所指的位置、拓扑或非空间属性来分类。准确性可用误差来衡量。精度(Precision):是对现象描述的详细程度。,(一)与数据质量有关的基本概念,空间分辨率(Spatial Resolution):是两个可测量值之间最小的可辩识的差异。比例尺(Scale):是地图上一个记录的距离和它所表现的“真实世界”的距离之间的一个比例。误差(Error):是表示数据与其真值之间的差异。误差研究包括:位置误差、属性误差、位置和属性误差之间的关系。,不确定性(Uncertainty):GIS中的不确定性包括空间位置的不确定性、属性不确定性、时域不确定性、逻辑上的不一致性及数据的不完整性。空间位置的不确定性:是指GIS中某一被描述物体与其地面上真实物体位置上的差异。属性不确定性:是指某一物体在GIS被描述的属性与其真实的属性之差异。时域不确定性:是指在描述地理现象时,时间描述上的差错。逻辑上的不一致性:是指数据结构内部的不一致性,尤其是指拓扑逻辑上的不一致性。数据的不完整性:是指对于给定的目标,GIS没有尽可能完全地表达该物体。,(二)空间数据质量指标和内容,许多国际组织和国家都制定了相应的空间数据质量标准和指标。空间数据质量指标的建立必须考虑空间过程和现象的认知、表达、处理、再现等全过程。,空间数据质量指标的内容:数据情况说明 位置精度或定位精度 属性精度 时间精度 逻辑一致性 数据完整性 数据相容性 数据的可得性 表达形式的合理性,二、空间数据质量的影响因素分析,空间现象自身的不稳定性空间数据的获取和表达中的误差空间数据处理中的误差,(一)空间现象自身的不稳定性,空间现象自身存在的不稳定性包括空间特性和过程在空间、专题、时间和内容上的不确定性。空间现象在空间上的不确定性:是指空间现象在空间位置分布上的不确定性变化。空间现象在时间上的不确定性:是指空间现象表现为在发生时间段上的游移性。空间现象在属性上的不确定性:是指空间现象属性类型划分的多样性、非数值型属性值表达的不精确性。,(二)空间数据的获取和表达中的误差,用全站仪、电子速测仪、GPS施测的野外测量误差:仪器误差、人为误差、环境误差等。由航片或近景测量所导致的遥感数据误差:地面控制点误差、几何校正误差、影像增强误差、影像分析误差等。地图数据误差:原始数据误差、坐标转换误差、制图综合与印刷产生的误差等。,(三)空间数据处理中的误差,产生误差的主要因素有地图投影变换地图数字化及矢量化处理数据转换空间分析数据的可视化表达,(四)空间数据使用中的误差,解译误差缺少对数据集相关信息的声明,三、空间数据质量的误差分析,按数据流程分为:源误差、处理误差、使用误差按数据类型分为:几何误差、属性误差、时间误差、逻辑误差按误差性质分为:随机误差、系统误差、粗差,在几何误差、属性误差、时间误差与逻辑误差四类误差中,属性误差与时间误差与一般信息系统中的概念一致,而几何误差是GIS所特有的。,(一)几何误差,点误差:点的测量位置与其真实位置的差异。点误差可通过计算坐标误差(x,y)和距离的方法得到。衡量整个数据采集区域或制图区域内的点误差的方法:抽样测算(x,y)。,1、点误差,2、线误差,线上的点在真实世界中可以找到的,如道路、河流、行政界线等,主要产生于测量和对数据的后处理。现实世界找不到的线,如按高程绘制的等高线,主要产生于解译误差。,(二)几何误差分析的方法,解析法实验法蒙特卡洛模拟法Epsilon带模型误差带模型其中,解析法、实验法、模拟法是研究GIS中几何误差的基本方法,主要用于研究点误差,Epsilon带模型和误差带模型主要用于线要素及线要素构成多边形和面要素误差分析。,四、空间数据质量的评价,空间数据质量的评价内容包括:数据集完整性 说明信息评价 地理目标数据评价,数据集完整性:包括要素分层的完整性、要素内容的完整性等。说明信息:用于描述对图中各地理实体有共同影响的因素,包括原始资料的说明、数据获取的方法和日期、数据处理方法、作业人员、数据格式、各种文档资料。地理目标数据:用于描述具体地理实体或某一部分的特征及其相互关系,评价内容包括位置精度、属性精度、数据的完整性、逻辑一致性和拓扑关系正确性等。,空间数据质量的评价,空间数据质量的评价:是用空间数据质量标准要素对空间数据所描述的三大基本特征(空间性、专题性、时间性)进行评价。用空间数据质量评价矩阵进行空间数据质量评价。,空间数据质量评价矩阵表,五、空间数据质量的控制,传统的手工方法元数据方法地理相关法,第五节“3S”技术的集成,“一个大脑,两只眼睛”的框架在实际应用中,较为常见的是3S两两之间的集成,一、3S技术集成的概念,二、3S技术集成中的理论和关键技术,3S集成系统的实时空间定位3S集成系统的一体化数据管理语义和非语义信息的自动提取理论与方法基于GIS的RS影像全数字化智能系统及GIS数据库快速更新方法3S集成系统中的数据通讯与交换3S集成系统中的可视化技术理论与方法3S集成系统的设计方法及CASE工具研究3S集成系统中基于客户机/服务器的分布式网络集成环境,三、3S技术的实用集成模式,定位直接获取GIS空间数据监控导航,(一)GIS与GPS的集成,(二)GIS和RS集成,分开但是平行的集成表面无缝的集成整体的集成 P138,图3-32,(三)GPS/INS与RS的集成,四、3S的整体集成,3S的整体集成不仅能自动、实时地采集、处理和更新数据,而且能智能式地分析和运用这些数据,为各种应用提供科学的决策咨询,并回答用户可能提出的各种复杂问题。同时集成并使用3S技术的应用实例并不多见。,作业,P140,2、3、6、9、12,