空间数据的采集和质量控制第5节GIS的数据质量.ppt
第5节 GIS的数据质量,一、GIS数据质量的内容和类型 1.GIS数据质量的基本内容 GIS数据质量包含如下五个方面:位置精度:如数学基础、平面精度、高程精度等,用以描述几何数据的质量。属性精度:如要素分类的正确性、属性编码的正确性、注记的正确性等,用以反映属性 数据的质量。逻辑一致性:如多边形的闭合精度、结点匹配精度、拓扑关系的正确性等。完备性:如数据分类的完备性、实体类型的完备性、属性数据的完备性、注记的完整性等 现势性:如数据的采集时间、数据的更新时间等 2.误差产生的主要原因 空间现象自身存在的不稳定性 空间现象的表达 空间数据处理中的误差 空间数据使用中的误差,第5节 GIS的数据质量,一、GIS数据质量的内容和类型 3.空间数据的误差类型 GIS空间数据的误差可分为源误差和处理误差:(1)源误差,是指数据采集和录入中产生的误差,包括:遥感数据:摄影平台、传感器的结构及稳定性、分辩率等 测量数据:人差(读数误差等)、仪差(仪器不完善等)、环境(干扰等)属性数据:数据的录入、数据库的操作等 GPS数据:信号的精度、接收机精度、定位方法、处理算法等 地图:控制点精度,编绘、清绘、制图综合等的精度 地图数字化精度:纸张变形、数字化仪精度、操作员的技能等(2)处理误差,是指GIS对空间数据进行处理时产生的误差,如:几何纠正;坐标变换;几何数据的编辑;属性数据的编辑;空间分析(如多边形叠置等);图形化简(如数据压缩);数据格式转换;计算机截断误差;空间内插;矢量栅格数据的相互转换。,第5节 GIS的数据质量,第5节 GIS的数据质量,二、研究GIS数据质量的方法 1.GIS数据质量的评价方法 直接评价法 1用计算机程序自动检测 某些类型的错误可以用计算机软件自动发现,数据中不符合要求的数据项的百分率或 平均质量等级也可由计算机软件算出。如可以检测编码是否正确等。2随机抽样检测 在确定抽样方案时,应考虑数据的空间相关性 间接评价法,是指通过外部知识或信息进行推理来确定空间数据的质量的方法。用于推理的外部知识或信息如用途、数据历史记录、数据源的质量、数据生产的方 法、误差传递模型等。非定量描述法,是指通过对数据质量的各组成部分的评价结果进行的综合分析来确定 数据的总体质量的方法。,第5节 GIS的数据质量,二、研究GIS数据质量的方法 2.研究GIS数据质量的常用方法 敏感度分析法,通过人为地在输入数据中加上扰动值来检验输出结果对这些扰动值的敏感 程度。然后根据适合度分析,由置信域来衡量由输入数据的误差所引起的 输出数据的变化。敏感度分析法是一种间接测定GIS产品可靠性的方法。尺度不变空间分析法,地理数据的分析结果应与所采用的空间坐标系统无关,即为尺度 不变空间分析,包括比例不变和平移不变。尺度不变是数理统计中常用的 一个准则,一方面在能保证用不同的方法能得到一致的结果,另一方面又 可在同一尺度下合理地衡量估值的精度。Monte Carlo实验仿真,首先根据经验对数据误差的种类和分布模式进行假设,然后利用 计算机进行模拟试验,将所得结果与实际结果进行比较,找出与实际结果 最接近的模型。空间滤波,可从含有噪声的数据中分离出噪声信息或者从含有噪声的数据中提取信号,然后用随机过程理论等方法求得数据的误差。对GIS数据质量的研究,传统的概率论和数理统计是其最基本的理论基础,同时还需要信息论、模糊逻辑、人工智能、数学规划、随机过程、分形几何等理论与方法的支持。,第5节 GIS的数据质量,三、数据采集中的数据质量评价 GIS中数据采集的方法:直接方法直接从野外采集,以获取观测数据、图象等 受人、仪器和环境影响,但已有传统方法可解决 间接方法从已有的图件上进行采集 除受直接方法中误差影响外,还有展绘控制点误差、编绘误差、制图综合 误差、数字化误差等 地图数字化是获取矢量数据的主要方法之一,也是GIS的重要误差源,是GIS数据质量研究的重点。地图数字化中,原图固有误差和数字化过程中引入的误差是两个主要的误差源,第5节 GIS的数据质量,三、数据采集中的数据质量评价 A.地图固有误差的来源和类型 除了含有控制点和碎部点引入误差外,还至少存在下列误差:控制点展绘误差 编绘误差 绘图误差 综合误差 地图复制误差和分版套合误差 绘图材料变形误差 特征的定义误差,展绘控制点是成图的第一步。当地图的精度要求不高时,该误差可不考虑,通常点状特征的编绘精度优于线状特征的编绘精度,即使是线状特征,分辨率和宽度不同,编绘精度也不同,绘图过程中产生的,其误差范围为0.060.18mm,其大小取决于特征的类型和复杂程度,有取决于采用的制图综合方法,如取舍、夸大等,因此,综合误差极难量化,地图印刷中产生的误差,如地图复制误差的均方差为0.10.2mm,环境条件变化,地图图纸也会发生变化,自然界的许多特征并无明确的界限,但在地图上却有明确的位置,第5节 GIS的数据质量,三、数据采集中的数据质量评价 B.数字化误差的评价方法 数字化的精度主要受数字化仪、数字化的方式、操作员的水平、数字化软件的 算法等影响。常用下列方法进行评价 自动回归法,由于跟踪数字化的数据是一个随机序列,存在序列相关性,同时还是一个时 间序列,因此可用数理统计中的时间序列分析法来确定数字化的误差。Band法,又称误差带方法,即在一条数字化线的两侧,各定义宽为的范围,作为 该数字化线的误差带,用的值来说明误差的范围,以及处理多边形叠置等 的误差。该方法适用于任何类型的GIS数据,关键是如何给出合理的值。对比法,把数字化后的数据,用绘图机绘出,与原图叠合,选择明显地物点进行量测,以确定误差。除了几何精度外,属性精度、完整性、逻辑一致性等也可用对比 法进行对照检查。,第5节 GIS的数据质量,四、数据处理中的数据质量评价 数字高程模型(DEM)的精度 原始资料的精度 影响因素:内插的精度 DEM精度的评价方法:原始等高线与再生等高线叠合评价的方法。,第5节 GIS的数据质量,四、数据处理中的数据质量评价 矢量数据栅格化的误差 属性误差:象元越大,属性误差越大。几何误差:几何误差的大小与象元的大小成正比。其中矢量数据表示的多边形网用象元逼近时会产生较严重的拓扑匹配问题。误差分析的一种方法:假设存在一幅理想的矢量地图,图上不同属性的制图单元由很细的线分开;对理想地图进 行观测采样得到一幅具有规则格网的栅格地图,把这两幅图进行叠置比较。理想地图是根本不存在的,但在这一假设下,可以提供一种仅利用栅格地图本身来估算矢 量数据栅格化的精度的方法。,第5节 GIS的数据质量,四、数据处理中的数据质量评价 多边形叠置产生的误差 包括:拓扑匹配误差、几何误差和属性误差 拓扑匹配误差 叠置的多边形的边界越精确,越容易产生无意义的多边形。多边形叠置所形成的多边形的数量与原多边形边界的复杂程度有关。合并无意义的多边形 A、用人机交互的方法把无意义的多边形合并到大多边形中;B、根据无意义多边形的临界值,自动合并到大多边形中;C、用拟合后的新边界进行合并。,