欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第4章+GIS数据采集和数据处理ppt课件.ppt

    • 资源ID:1354271       资源大小:2.75MB        全文页数:88页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第4章+GIS数据采集和数据处理ppt课件.ppt

    第4章 GIS数据采集和数据处理,4.1 GIS数据源4.2 地理数据分类和编码4.3 GIS数据采集和输入4.4 GIS数据处理4.5 数据质量和精度控制,空间信息的获取是一个空间信息系统建设的首要任务。一个空间信息系统建设,70以上的工作(费用)将花费在空间信息的获取上面。,4.1 GIS数据源,GIS数据源自地图数据、遥感数据、文本资料、统计资料(电子和非电子数据)、地表实测数据、野外测量或GPS数据、多媒体数据和已有系统的数据等,其中,遥感数据(RS Data)和全球定位系统数据(GPS Data)是GIS的重要数据源。各类数据输入见教材图4.1。,图4.1 数据采集与输入流程图,4.1.1地图数据纸质地图(Hardcopy Map)和图表是GIS的主要数据源,它不仅含有实体的类别和属性,而且含有实体间的空间关系。地图数据主要通过对纸质地图的跟踪数字化和扫描数字化获取。地图数据通常用点(居民点、采样点、高程点、控制点等)、线(河流、道路、构造线等)、面(湖泊、海洋、植被等)及注记(地名注记、高程注记、人口注记等)。地图注记往往是对GIS属性特征的描述,地图符号间的关系对应为目标间的框架关系。地图表达中蕴含着大量的信息内容,需要通过人工判读识别出来,这往往取决于数据采集人员的专业知识、地图判读经验。,4.1.2遥感数据1.遥感影像包括航空相片和卫星影像。航空相片是指安装在飞机上的照相机,沿着预定的航向,按照一定的飞行高度和重叠度摄取的地表影像。与地图比较,航空相片所包含的信息内容丰富、客观真实,它不加选择地、详细地记录了在拍摄时刻被摄地区的地表现象,而不像地图内容是经过了地图制图人员的选取和概括的产物。通过对航空照片的解译和野外调绘,可以获取有关地区生态环境各要素数据。航空相片解译或调绘的成果通常转绘成地图,以地图的形式经数字化输入GIS,成为GIS的一个重要数据源。所以航空照片为显示专题要素提供背景,为地理数据更新提供依据。卫星影像是利用安装在卫星上的传感器接受由地面物体反射或发射的电磁波能量,经模数转换和计算机处理而获得的地表影像数据。如:TM1-7数据、SPOT5数据、IKONOS数据、NOAA数据、MODIS数据等,已成为GIS另一个重要的数据源。,SPOT 5 数据各种融合影像,2.GIS与RS数据关系由于卫星影像以数字形式存在,所以可直接或经过预处理后输入到GIS中,特别是影像处理软件(如:ERDAS或ENVI等)可以根据地理实体在影像上呈现的颜色将它们区别开,并能将辨别出来的地理实体组织成不同的栅格图层,存入地理数据库;由于卫星遥感周期性地重复获取同一地区的影像,利于获取监测、动态数据,利于实时更新地理数据库;通过使用不同波段的卫星影像或将不同波段的影像进行融合处理后,可提取或解译有关的专题要素,用于特定的分析和应用;与其他地理数据源相比,卫星数据获取的费用相对较低,它是目前GIS的重要数据源之一;GIS也可用卫星影像为背景显示专题要素,制作卫星影像地图用于区域分析;利用卫星影像有利于更新数据库的数据。,4.1.3野外测量和全球定位系统(GPS)数据在没有所需的地图或遥感影像数据的情况下,就需要通过野外测量或使用GPS采集数据作为GIS的输入。目的在于确定测量区域内地理实体或地面各点的平面位置和高程。一般野外试验、实地测量等获取的数据可以通过转换直接进入GIS的地理数据库,以便于进行实时的分析和进一步的应用。GPS是一种采用距离交会法的卫星导航定位系统。通过测定测距信号的传播时间来间接测定距离,将无线电信号发射机从地面站搬到卫星上,组成一个卫星导航定位系统,较好地解决覆盖面与定位精度之间的矛盾。GPS由空间部分、控制部分和用户设备三部分组成。近年来,GPS已越来越多地应用于GIS数据的野外采集。,4.1.4其他数据源 其他数据包括:文本资料、统计资料、实测数据、多媒体数据、原有系统的数据等。1.文本资料 文本资料是指各行业、各部门的有关法律文档、行业规范、技术标准、条文条例等,如边界条约等。这些也属于GIS的数据。2.统计资料 各种类型的统计报告、社会调查数据等,是GIS属性数据的重要来源。3.实测数据如野外实地勘测数据、量算数据;台站的观测记录数据;遥测数据。4.多媒体数据 多媒体数据(包括声音、录像等)通常可通过通讯口传入GIS的地理数据库中,目前其主要功能是辅助GIS的分析和查询。,5.原有系统的数据 GIS还可以从其它已建成的信息系统和数据库中获取相应的数据。由于规范化、标准化的推广,不同系统间的数据共享和可交换性越来越强。这样就拓展了数据的可用性,增加了数据的潜在价值。,为整合各种来源的空间数据并进行数据处理,对于数据的分类和编码是很重要的。例如,空间数据的地理参照系(地球的形状、坐标系、高程系)的不同,引起空间数据来源不同时图幅往往不匹配,为此需要将一种投影的数字化数据转换为所需要投影的坐标数据,即进行投影转换。投影转换的方法有:解析变换(正解变换、反解变换)、数值变换、解析和数值变换。目前,大多数GIS软件是采用正解变换法来完成不同投影之间的转换,并直接在GIS软件中提供常见投影之间的转换。,4.2. 地理数据分类和编码,4.2.1地理数据的分类1.分类概念及原则分类是指根据属性或特性将地理实体划分为各种类型,表示同一类型地理实体的数据可以采集在一起,构成一个图层(如图4.2所示)。,图4.2 现实世界和图层划分,GIS是根据地理实体的类型(点或线或面)通过数字化采集和组织地理数据的。分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。拟定分类体系是进行空间数据编码的工作基础,其目的是识别要素和提供要素的地理含义。地理数据的分类体系由两部分组成,即类型名称和描述。类型名称可以根据地理实体的形态或功能而定,但究竟是形态分类还是功能分类,主要取决于地理数据的应用。分类体系的描述部分则是描述各类地理实体的基本功能和性质。例如八大土地类型是“类型名称”,各地类的特性如何则属于“描述”。,注意几个问题:(1)分类体系问题。在一个大型GIS项目中,除非已有一个合适的分类系统,否则需要在深入理解用户需求的基础上,建立一个完整的地理数据分类体系,为地理数据的采集、编码和存储提供标准。(2)分类依据。一个理想的地理数据分类体系应该具有科学性、系统性、完整性和一致性,并能做到简明、充分满足地理数据应用要求。分类过细或过粗都会导致一些潜在的实际问题。(3)使用特征码。在GIS中,分类系统用特征码表示。特征码就是按照信息分类编码的结果,利用一组数字、字符或数字字符的混合来标记不同类别信息的代码。特征码多采用线分类法,它是将空间实体根据一定的分类指标形成若干层次目录,构成一个分层次、逐级展开的分类体系。拟定编码系统。由于分类系统是一个分级系统,因此使用的特征码必须采用统一拟定的编码系统,并符合各行各业邻域的分类分级体系,拟定的特征码要能为多用途数据库提供足够的实用信息,便于计算机处理与信息交换,易于识别和记忆,并使冗余数据最少,代码长度适度。分类与编码主要原则。如: 标准化和通用化; 唯一性和代表性; 清晰性和明确性; 可扩充性和稳定性; 完整性和易读性。,目前,有关地理基础信息数据分类体系的中国国家标准主要包括1992年发表的“国土基础信息数据分类与代码”(标准编号:GB-T13923)、1993年的“1:500,1:1000,1:2000地形图要素分类与代码”(标准编号:GB-T14804)、1995年的“1:5000,1:10000,1:25000,1:500000,1:100000地形图要素分类与代码”(标准编号:GB-T15660)和2001年颁布的“专题地图信息分类与代码”(标准编号:GB-T18317)。不同的专业部门也有相应的分类系统。例如1984年,中国农业区划委员会根据土地的用途、经营特点、利用方式和覆盖特点等因素,将土地划分为八个一级类型、46个二级类型,表4.2描述了其中八个一级类型。,2.分类码和标识码分类码是直接利用信息分类的结果制定的分类代码,用于标记不同类别信息的数据。分类码一般由数字或字符或数字字符混合构成。例如:美国地质调查局(USGS)制订的数字线划图形标准中的7位代码结构,前三位为主码,后四位为子码,如图4.3所示。,图4.3 USGC数字线划图形标准采用的代码结构,例子说明:中国1:100万地形数据库的数据分类体系采用三级结构,即代码由三段码组成:归属码、分类码和标识码。归属码说明数据来源,包括提供数据的单位、系统名称和数据库名称等,它除在不同系统之间交换或转换数据外,一般不使用;分类码说明实体所属的类别,它完全按照国土基础信息数据库分类与代码国家标准;标识码也称识别码,用于标识主要的要素实体,如县级以上居民地及其行政界线、铁路、主要公路、主要河流和湖泊等,用于对实体界线检索,标识码有6位字符和数字混合构成。代码结构和标识码示意,如图4.4所示。,图4.4 代码结构和标识码示意图,进一步说明:代码是给予被处理对象(事物、概念)的符号,是用来代表事物某种属性的一组有序的字母,具体地说,代码可用来代替某一名词、术语,甚至某一个特殊的描述短语。它是人机的共同语言,是进行信息分类、校对、统计和检索的关键。由于当前计算机只能识别以二进制为基础的数字、英文、汉字及少数特殊符号。代码设计就是如何合理地把被处理对象数字化、字符化的过程。代码设计是一项复杂的工作,需要多方面的知识和经验。涉及面广的代码,一般要由几方面人员在标准化部门组织下进行,制定后要正式颁布,统一贯彻。代码是用来表征客观事物的一个或一组有序的符号,它应易于计算机和人识别与处理。代码也简称为“码”。编码就是用数字或字母代表事物。通过编码,建立统一的信息语言,有利于提高通用化水平,使资源共享,达到统一化;有利于采用集中化措施以节约人力,加快处理速度,便于检索。具体地讲,代码具有鉴别功能、分类、排序以及专用含义,4.2.2地理数据的编码地理编码是在数据分类的基础上,以易于计算机和人识别的代码(Code)唯一地标识地理实体的类型,代码由字符(数字或字母或数字和字母混合)构成,由于代码简单,计算机易于准确操作和管理,在地理数据库中,地理实体的类别大多以代码表示。在地理数据采集过程中,要以代码标识地理实体的类型和属性,是GIS设计中最重要的技术步骤 地理编码,它是现实世界与信息世界之间的转换接口(实际就是一个应用程序连接) 。,通用地理编码的基本要求包括: 要素识别(即地方名称、实体类型、地址等); 要素位置(用于唯一地识别实体在地表上的位置); 要求特征(属性); 作用范围描述; 提供地理定义。服务于空间分析的地理编码分为拓扑编码和坐标编码(详见第3章)。根据有关原则设计的代码主要用于控制地理数据数字化采集和输入,用于在地理数据库中系统地表示地理实体以及它们的属性。代码以及相应的描述通常也存储在地理数据库中作为元数数据的一部分,以帮助用户理解、分析、管理和显示地理数据。,4.3 GIS数据采集和输入,地理数据采集主要指实地调查和采样,包括野外考查、GPS定位等。所选择的数据源资料一般要经过预处理(对空间数据分幅、分层和分专题要素)才能借助数字化或其它途径转换成空间数据库可用的数据。空间地理数据无论是来源于数字数据,还是来源于模拟数据,都需要与所使用的GIS软、硬件相兼容。模拟数据,需经过数字化才能输入到GIS中;常用的模拟数据输入方法有:手工数字化、自动数字化(包括扫描)和键盘输入等。计算机虽可阅读和存储数字数据,但输入的数字数据格式与所用的GIS软件不一致时,要经过数据格式转换后才能输录入。GIS数据采集与输入的同时,还实现数据编辑功能。数据录入和编辑就是各图层实体的地物要素按顺序转化为x、y坐标及对应的代码输入到计算机中。,4.3.1建库前准备1资料准备,区域标定一般包括如下几项内容: 基础原始数据的确定(一般只采集存储基础的原始数据,不存储派生的数据,但若使用频率很高,也可作基础数据存储,这就是“数据采集存储原则”); 数据分类项目的确定(即数据分类); 数据标准准确性的确定(即数据编码)。,2进行地理基础的三个统一地理基础的三个统一,即:投影、比例尺、分类分级编码的统一。3软件检查软件功能测试运行和系统调试等检查及其他辅助工作。4硬件检查主机和外设(包括数字化仪、扫描仪、打印机、绘图仪等的设备)等是否正常工作。5其它工作(1)数据的预处理(包括对数据源数据的取舍、增强、分离、证实、加工以及再生产)。(2)建立数据的质量标准和数据管理责任制。(3)数据库入库的组织管理工作。,4.3.2几何图形数据的采集1.数字化方式 常用的有三种:(1)手扶跟踪数字化:手扶跟踪数字化设备要求特定的手扶跟踪数字化仪;除对处理简单图形要素,效率较高外,也适于更新和补充少量内容;输入一般多采用点方式,但也可根据实际情况选用点、流或结合方式 。(2)屏幕数字化:屏幕数字化需要扫描数字化设备以及屏幕数字化软件。使用该软件精度较高、劳动强度较低。(3)扫描数字化:设备要求有一定的扫描设备及配套的栅格编辑和矢量化软件;使用时速度较快、精度较高、劳动强度低;但使用时需规定最低分辨率和采点密度。扫描影像时,应考虑软硬件的承受能力和查询显示速度。对于线划图,扫描后通过栅格_矢量转换软件(如:R2V)处理后,得到矢量数据,可大大提高数字化工作效率。但对原图数据要求较高,所以,一般应需要对比强、线划实在、背景质地光滑的数据,否则转化得到的线划图就会发生断线、歪曲连通性等严重错误。,(1)设置好数字化仪,(2)确定投影方式和坐标系统 地图投影方式和坐标系选择得是否恰当,直接影响地图的精度和使用价值。选择时,主要考虑以下因素: 制图区域的范围、形状和地理位置; 地图的用途、出版方式及其他特殊要求。,数字化一般步骤:,(3)利用数字化软件,屏幕跟踪矢量化一般步骤: (1)准备扫描图像。 (2)栅格图像配准:选择投影和单位、输入控制点以及编辑控制点。 (3)新建数字化图层 (4)屏幕跟踪矢量化地图,图4.5 栅格量化过程,注意:不管采用何方式采集数据,为了适应空间分析,都应注意以下几点:(1)采集精度符合质量控制的要求。(2)采点密度应合理。(3)实体采集要精确(如:点状要素应采集符号的几何中心点或定位点;线状要素应沿中轴线采集;面状要素应采集多边形边界和标识点,边线应严格闭合)。,2.几何图形数据的采集步骤几何图形数据的采集步骤如下。(1)地图数字化前需要对数字化底图进行适当处理,主要包括: 减少图纸变形的影响; 线划要素的分段; 选取控制点。(2)确定数字化路线。在数字化之前一定要设计好数字化所采用的技术路线,这关系到地图数字化的效率。确定数字化路线包括: 选择底图,底图的选取主要考虑底图的精度和要素的繁简; 地图分层与分幅,即对哪些要素数字化,对要数字化的要素进行分层并确定图名;对图幅大的还要涉及对数字化地图的分幅与拼接。,(3)地图数字化过程。是指把传统的纸质地图或其它材料上的地图(模拟信号)转换为计算机可识别的图形数据(数字信号)的过程,以便进一步在计算机中进行存储、分析和输出。(4)地图数字化包括手工数字化、半自动数字化和自动数字化。,手工数字化(Manual Digitizing):是指不借用任何数字化设备对地图进行数字化,即手工读取并录入(键盘输入)地图的地理坐标数。其容易导致位置误差。手工数字化按照空间数据的存储格式的不同分为以下几种:手工矢量数字化:是指直接读取地理实体坐标数据并按一定格式记录下来。具体步骤为:第一,对地理实体编码;第二,量取地理实体的坐标;第三,录入坐标数据;第四,由GIS软件转换成一定格式的矢量数据。手工栅格数字化:是指将图面划分成栅格单元矩阵,按地理实体的类别对栅格单元进行编码,然后依次读取每个栅格单元代码值的数字化方法。一般步骤为:第一,确定栅格单元大小(由网格精度要求而定);第二,准备栅格网(一般用聚酯薄膜透明格网);第三,对栅格单元进行编码;第四,读取栅格单元值;第五,数据录入(由键盘输入格网的行数、列数、网格的边长等)。,手扶数字化仪数字化:指利用手扶数字化仪进行地图数字化。操作需要以下几个基本步骤。第一步 准备数字化原图。先检查原图内容的完整性。例如,查看多边形是否闭合,线划是否连续等;其次在岛屿多边形上标出一个起始顶点,以保证在数字化岛屿多边形时,最后返回到它的起始顶点;接着在原图上选择和标出四个或四个以上的控制点,每个控制点都必须具有已知的实地注标(经、纬度或地图平面直角坐标),通常选择原图的图幅角点,经纬网或公里网格网交点,或在实地坐标已知的显著地物作为控制点。为保证精度,可将原图内容复制或转绘到不变形的聚酯薄膜上。在原图准备好以后,将它固定到数字化台面上。第二步 定义数字化规则。包括确定如何将原图包含的要素划分成若干图层,每一个图层应当包含同一实体类型(点、线或面)或同一主题要素,数字化需按图层进行,即一个图层数字化完毕后,再数字化另一图层的要素。此外,在数字化之前,还应当确定图形选取和概括的规则,以控制地图或地理数据综合的程度。,第三步 数字化控制点。将数字化仪游标上的十字丝交点对准在原图上标识好的控制点,并记录它们的点坐标,然后由键盘输入它们的实地坐标。数字化仪记录的点位坐标是相对于数字化台面坐标原点(台面左下角)的平面直角坐标(以厘米为单位),控制点的实地坐标用于将数字化台面坐标转换成在地面的实际坐标。在数字化仪控制软件接收到控制点的实地和数字化台面坐标以后,它计算出一个转换矩阵,并将这个转换矩阵自动地应用于后续数字化采集的坐标数据,再将它们转换成地面实际坐标,然后输入GIS,以此类推。控制点的数字化必须尽可能地精确,因为它决定了坐标数据转换的精度。第四步 数字化地理实体的几何图形。图形数字化实际上是获取构成点、线或面的所有特征点或顶点的坐标。点状实体数字化为一个点;线状实体数字化为一个有序点集。GIS显示软件将所有点按顺序以直线段相连,形成弧或线段链,点的顺序标志着弧的方向,从而可以建立实体的拓扑关系。面状实体或多边形实体可被数字化为首末同点的有序点集,也可被数字化为一系列的弧段以避免重复数字化相邻多边形的共同边界。每个实体数字化以后,数字化仪控制软件都会自动赋给它们唯一的标识码,用于输入或连接它们的属性数据。,第五步 检查和修正数字化错误。手工检查或用软件识别几何错误(如多边形不闭合、线段不相交等),绘出数字化图形,将它与原图叠加在一起通过比较找出错误(在“GIS数据编辑”部分还会进一步说明)。第六步 输入属性数据。每一个数字化地理实体的属性数据一般由键盘以数据库表格的形式输入,然后以第四步产生的实体标识码为关键字,将属性数据表与数字化的坐标数据相连。在一些GIS软件中,多边形实体的属性数据往往连接到多边形中心点,常称为多边形标识点(Lable Point)。多边形标识点可在数字化多边形后通过手工数字化获取,或在GIS软件将数字化的弧段形成多边形时自动产生。,提示:大多数手扶数字化仪提供两种操作方式。点方式(Point Mode)。点方式是由操作员选取图形特征点,按动游标上记录点位的按钮获取点的坐标(上述介绍就是点方式)。使用点方式,操作员可以根据图形的复杂程度确定特征点的选取密度。值得一提的是,这个操作实际上就是地图概括的过程。流水方式(Stream Mode)。流水方式是将数字化过程半自动化。在流水方式下,数字化仪控制软件每隔预先设置的时间或距离间隔,自动记录游标十字丝交点所在的点位坐标。,自动数字化主要有两种方法:扫描和自动跟踪数字化。 扫描数字化:获取栅格数据的主要方法是使用扫描仪。通过对地图原图或遥感相片作逐级扫描,将采集到的原图资料上图形的反射光强度转换成数字信息,以栅格数据格式输出地图或相片的数字影像。地图和遥感相片的扫描数字化主要采用滚筒式扫描仪和大幅面送纸式扫描仪。扫描仪数字化数据在GIS中主要有两个用途。一是扫描输出的地图和相片数字影像按照一定的地表坐标参照系定位,可用作显示矢量数据背景。二是经扫描以栅格数据格式输出的地图和遥感相片经过一个矢量化过程,可转换成矢量数据。矢量化是将栅格数据转换成矢量数据的过程 。,扫描矢量化处理流程:准备纸质地图坐标配准扫描转换拼接子图块裁剪地图屏幕跟踪矢量化矢量图合成、接边矢量图编辑存入空间数据库。屏幕跟踪矢量化流程:准备扫描图像选择要数字化的地图识别该图的投影和坐标系统在图上选取至少4个控制点并获取控制点的实际地理坐标然后将地图扫描成GIS软件可识别的栅格图像格式保存。如果没有现成的坐标系统,也可以在图上建立自己的坐标系统并读取相应的控制点的坐标。 自动跟踪数字化:使用具有激光和光敏器件的自动跟踪数字化仪,模拟手工数字化方法自动跟踪地图上的线划。自动跟踪数字化仪输出的是矢量格式的(x,y)坐标串,但精度不是很高。,4.3.3属性数据采集和组织1.属性数据的采集(1)键盘输入方式:属性数据可以从键盘输入到计算机数据文件中,或直接输入到数据库(如Foxpro、Access等)中。某些GIS项目还设计特定形式的、具有数据类型约束的数据输入表用于输入属性数据(如MapInfo 软件设计的是Table表等)。属性数据大多以二维表的形式输入,表的行表示地理实体,列表示属性。但属性数据表必须有一个能与定位数据相关联的关键字(如地理实体的唯一标识码)。(2)人机交互方式:用程序批量输入或辅助于字符识别软件进行输入。(3) 注记识别转换输入:地图上的某些注记往往是对实体目标数量、质量特性描述的属性信息,通过扫描后,能自动识别获得这些信息,并将它们转储到属性表中,完成注记识别转换输入。2.属性数据的组织 属性数据的组织有文件系统、层次结构、网络结构与关系数据库管理系统等。,4.3.4属性和几何数据的连接在数据的组织与管理中,最为关键的是如何将空间数据与属性数据融合为一体。GIS的数据存储结构是由数据的组织决定的。例如:ArcView GIS软件的数据存储结构是二维表格,其中属性数据和几何数据的关联是通过标识符(ID码)连接的(如图4.6所示)。标识符可手工输入或由系统自动生成(如用顺序号代表标识符等)。,图4.6空间数据与属性数据的综合体,注意: 目前GIS的地物属性数据库大多是以传统的关系数据库为基础的。基于属性的GIS查询可以通过关系数据库的SQL语言进行查询。地物的图形数据和属性数据虽是分开存储的,但图形和属性之间的关联是通过目标的ID码,通过SQL语言进行操作查询数据库。,4.4 GIS数据处理,数据处理涉及的内容很广,主要取决于原始数据的特点和用户的具体需求。一般有数据变换、数据重构、数据提取等内容。数据处理是针对数据本身完成的操作,不涉及内容的分析。空间数据的处理也可称为数据形式的操作。GIS数据的编辑处理主要包括: 误差识别与纠正,包括地图和相片数字化过程中产生的误差,以及由于地图或相片变形引起的误差; 地图投影和坐标系统的转换,以保证所有的地理数据具有统一的投影和坐标系统; 数据结构转换,即根据数据输入格式和分析的需要,实现矢量到栅格或栅格到矢量的转换; 数据的综合概括,以删去数据中不必要的细节; 图幅边缘匹配,以便于相邻图幅数据的合并或跨图幅的空间分析。,4.4.1空间数据格式的转换常用的地理数据格式见表4.3。由于许多GIS软件系统使用其专用数据格式(如ArcView是用shape数据,Arc/Info是用coverage数据等),且地理数据格式繁多,虽理论上数据格式转换没问题,但实际操作有的难度较大。数据格式转换中,需要格式解译程序。一般有直接转换和间接转换两种。在数据格式转换中,由于两种系统对数据表达的差异,数据转换后往往会产生失真、歪曲、信息丢失的现象,这不是数据精度的问题,而是对数据的逻辑组织上两套系统关注的侧重点有所差异。,4.4.2空间数据坐标的转换除数据格式外,数据处理和变换还包括数据从一种数学状态转换为另一种数学状态(即投影变换、辐射变换、比例尺变换、误差修正等);数据从一种几何形态转换为另一种几何形态(如数据拼接、数据截取、数据压缩、结构转换等);数据从全集合到子集合的条件提取(包括类型选择、窗口提取、布尔提取和空间内插等)。空间数据坐标变换的实质是建立两个平面点之间的一 一对应关系,包括几何纠正和投影转换等。,1.地图投影变换地图投影变换是将一种投影转换为另一种投影,使得坐标数据能匹配,通常包括三种方法: 解析变换,x, y , X, Y,或者 根据原投影点的坐标x反解出纬度,然后根据、y而求得新投影点的坐标(X、Y); 数值变换法, 基于数值逼近理论实现两未知投影间的转换,寻找同名点,建立n次多项式变换函数,基于最小二乘原理,解算系数。 数值解析变换法, 已知新投影方程式,而原投影方程式未知时,可采取类似上述的多项式,求得资料图投影点的地理坐标(,),即反解数值变换,然后代入新方程式中,即可实现两种投影间的变换。,2.坐标转换空间数据坐标变换的实质是建立两个平面点之间的一一对应关系,包括几何纠正和投影转换,它们是空间数据处理的基本内容之一。对于数字化地图数据,由于设备坐标系与用户确定的坐标系不一致,以及由于数字化原图图纸发生变形等原因,需要对数字化原图的数据进行坐标系转换和变形误差的消除。有时,不同来源的地图还存在地图投影与地图比例尺的差异。因此还需要进行地图投影的转换和地图比例尺的统一。几何纠正是为了实现对数字化数据的坐标系转换和图纸变形误差的改正,市场上常见的几种商用GIS软件一般都有仿射变换、相似变换、二次变换等几何纠正功能。设x、y为数字化仪坐标,X、Y为理论坐标,m1、m2为地图横向和纵向的实际比例尺,两坐标系夹角为,数字化仪原点O相对于理论坐标系原点平移了a0、b0,则根据图形变换原理得出坐标变换公式(4.1)。,仿射变换是GIS数据处理中使用最多的一种几何纠正方法。它的主要特性为:同时考虑到x和y方向上的变形,因此纠正后的坐标数据在不同方向上的长度比将发生变化。 其它方法还有相似变换和二次变换等。 经过仿射变换的空间数据,其精度可用点位中误差表示,见(4.2)式。,(4.2),其中式中:,n为数字化已知控制点的个数。,坐标转换简单方法表示:,投影变换,4.4.3空间数据结构的转换1.由矢量向栅格转换矢量数据转换成栅格数据(如图4.7所示)的主要方法有以下四种。(1)内部点扩散法:由多边形内部种子点向周围邻点扩散,直至到达各边界为止。(2)复数积分算法:由待判别点对多边形的封闭边界计算复数积分,来判断两者关系。(3)射线算法和扫描算法:由图外某点向待判点引射线,通过射线与多边形边界交点数来判断内外关系。(4)边界代数算法:是一种基于积分思想的矢量转栅格算法,适合于记录拓扑关系的多边形矢量数据转换,方法是由多边形边界上某点开始,顺时针搜索边界线,上行时边界左侧具有相同行坐标的栅格减去某值,下行时边界左侧所有栅格点加上该值,边界搜索完之后即完成多边形的转换。,图4.7矢量向栅格转换的示意,2.由栅格向矢量转换栅格数据转换成矢量数据主要方法为:提取具有相同编号的栅格集合表示的多边形区域的边界和边界的拓扑关系,并表示成矢量格式边界线的过程。一般步骤包括:多边形边界提取,即使用高通滤波,将栅格图像二值化;边界线追踪,即对每个弧段由一个节点向另一个节点搜索;拓扑关系生成和去除多余点及曲线圆滑。过程见教材图4.8所示。,图4.8 栅格向矢量转换过程图,栅格向矢量转换处理的目的,是为了将栅格数据分析的结果,通过矢量绘图仪输出,或为了数据压缩的需要,将大量的面状栅格数据转换为由少量数据表示的多边形边界,但是主要目的是为了能将自动扫描仪获取的栅格数据加入矢量形式的数据库。转换处理时,基于图像数据文件和再生栅格文件的不同,分别采用不同的算法。目前基于GIS工具软件可以实现由栅格向矢量转换,例如ArcView 3.3 就可以直接实现GRID格式向TIN格式转换。,4.4.4数据检查和编辑通过矢量数字化或扫描数字化所获取的原始空间数据,都不可避免地存在着错误或误差,属性数据在建库输入时,也难免会存在错误,所以,对图形数据和属性数据进行一定的检查、编辑是很有必要的。图形数据和属性数据的误差主要包括以下几个方面:(1)空间数据的不完整或重复:主要包括空间点、线、面数据的丢失或重复;区域中心点的遗漏;栅格数据矢量化时引起的断线等;(2)空间数据位置的不准确:主要包括空间点位的不准确、线段过长或过短、线段的断裂、相邻多边形结点的不重合等。(3)空间数据的比例尺不准确;(4)空间数据的变形。(5)空间属性和数据连接有误。(6)属性数据不完整。,矢量的实体错误包括伪节点、摇摆结点、碎多边形和标注错误等。为发现并有效地消除误差,一般采用如下三种方法进行检查。(1)目视检查法:指在屏幕上用目视检查的方法,检查一些明显的数字化误差与错误,包括线段过长或过短、多边形的重叠和裂口、线段的断裂等;例如:通过图形实体与其属性的联合显示,发现数字化中的遗漏、重复、不匹配等错误;或在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误;对于面状要素,可在建立拓扑关系时,根据多边形是否闭合来检查,或根据多边形与多边形内点的匹配来检查等;对于属性数据,通常是在屏幕上逐表、逐行检查,也可打印出来检查;对于图纸变形引起的误差,应使用几何纠正来进行处理。,(2)逻辑检查法:如根据数据拓扑一致性进行检验,将弧段连成多边形,进行数字化误差的检查。有许多软件已能自动进行多边形结点的自动平差。另外,对属性数据的检查一般也最先用这种方法,检查属性数据的值是否超过其取值范围。属性数据之间或属性数据与地理实体之间是否有荒谬的组合。对等高线,也可通过确定最低和最高等高线的高程及等高距,编制软件来检查高程的赋值是否正确;(3)叠合比较法:是空间数据数字化正确与否的最佳检核方法,按与原图相同的比例尺用把数字化的内容绘在透明材料上,然后与原图叠合在一起,在透光桌上仔细地观察和比较。一般地,对于空间数据的比例尺不准确和空间数据的变形马上就可以观察出来,对于空间数据的位置不完整和不准确则须用粗笔把遗漏、位置错误的地方明显地标注出来。如果数字化的范围比较大,分块数字化时,除检核一幅(块)图内的差错外还应检核已存入计算机的其它图幅的接边情况。,对于空间数据的不完整或位置的误差,主要是利用GIS的图形编辑功能,如删除(目标、属性、坐标)、修改(平移、拷贝、连接、分裂、合并、整饰)、插入等进行处理。对空间数据比例尺的不准确和变形,可以通过比例变换和纠正来处理。4.4.5空间数据的压缩和综合 空间数据采集采用了高频率的点集记录,或者采用的数据的比例尺大于所要求的,数据表达分辨率太高与其他数据不能匹配,则要采用空间数据压缩或地图综合技术降低数据量,降低表达的分辨率,使数据在比例尺表达上能够匹配。,1.空间数据压缩为减少存储空间、简化数据管理、提高数据传输效率、提高数据的应用处理速度,应通过特定几何算法对空间数据压缩,形成不同详细程度的数据,为不同层次的应用提供所需的适量信息。采用方法通常为坐标串抽稀,如图4.9所示。,图 4.9 等高线数据的压缩,2.地图综合(1)概念通俗意义上的综合是思维的抽象化过程,即从精细到粗略的表达。对应的概念有: 概括、抽象化、粗化、化简等。地图综合是在比例尺变化上的一种图形变换,随着比例尺缩小,保留重要地物去掉次要地物,以概括的形式表达图形。它是在比例尺缩小后,从一个新的抽象程度对空间现象的简化。地图综合的操作包括:选取、化简、合并、夸大、移位、骨架化等。在GIS数据处理中通过地图综合技术获得简化的地图数据。,(2)数据压缩与地图综合异同:相同处:都导致信息量的减少,都是为了缩小存储空间和节省计算处理时间而去掉繁杂细节。不同处:数据压缩一般是在无损图解精度的前提下去掉“贡献”小而用插值方法可近似恢复原数据,即数据压缩可用数据的插值加密手段进行逆处理;而制图综合不受图解精度约束,被删除或被派生的信息不可逆。也就是说,数据压缩只是几何细节上的较小程度的变换,地图综合则是较大程度的变换,在地理表达层次上获得新的数据表达,如将群集分布的建筑物合并综合后获得居住区的分布,已经产生了新的地理概念“居住区”。而对建筑物的压缩仍然保持各多边形建筑物的独立性,只是通过边界点的抽稀对形状作简化处理。地图综合例子可见图4.10和4.11。,图4.10 等高线数据综合示意,图4.11 建筑物居住区综合示意,4.4.6空间数据的插值方法空间数据插值(包括内插和外延)是用已知点的数值来估算其他点的数值的过程。在GIS应用中,空间插值主要用于栅格数据,估算出网格中每个单元的值。方法主要有:全局方法和局部方法。实现全局方法可用趋势面分析、回归分析等;实现局部方法可用泰森多边形、密度估算、反距离权重插值、薄板样条函数法、克利金法 。,4.4.7多源空间数据的整合在GIS空间数据库中,有空间数据、时间数据和属性数据,为了数据共享,我们可以从空间、时序和管理三个方面对区域数据进行整合。一般原则为: 空间上应按照统一范式的区域划分; 时间上按时序划分为过去、现在和将来,以便GIS时空动态分析; 管理上应依靠通用软件操作的数据要求 。,多源数据集成、加工处理以及建立数据库过程如图4.12所示。,图 4.12 多源空间数据集成、加工处理及建立数据库图示过程,4.5数据质量和精度控制,4.5.1 GIS数据质量GIS数据质量包含如下五个方面。 位置精度,如数学基础、平面精度、高程精度等,用以描述几何数据的质量; 属性精度,如要素分类的正确性、属性编码的正确性、注记的正确性等,用以反映属性数据的质量; 逻辑一致性,如多边形的闭合精度、结点匹配精度、拓扑关系的正确性等; 完备性,如数据分类的完备性、实体类型的完备性、属性数据的完备性、注记的完整性等; 现势性,如数据的采集时间、数据的更新时间等。,GIS数据质量的高低对GIS空间分析影响很大。也就是说,GIS数据在采集、处理过程中会存在数据不确定性问题。近年来,为了保证地理数据质量,促进地理数据的交换和共享,许多国家、地区和国际组织相继制定了一系列地理数据标准,一些主要的GIS软件开发商也制定了它们自己的数据标准。这些标准的建立和遵循,对于数据的交换、数据间的兼容,提高地理数据的利用率和使用价值是有利的。有关中国的地理数据标准可参阅2003年何建邦等编著的地理信息共享的原理与方法一书。,4.5.2 GIS数据的误差衡量GIS空间数据(几何数据和属性数据)的可靠性,通常用空间数据的误差来度量。误差是指数据与真值的偏离。GIS空间数据的误差可分为源误差和处理误差。1源误差:指数据采集和录入中产生的误差,包括以下几种。(1)遥感数据:摄影平台、传感器的结构及稳定性、分辨率等。(2)测量数据:人差(对中误差、读数误差等)、仪差(仪器不完善、缺乏校验、未作改正等)、环境(气候、信号干扰等)。(3)属性数据:数据的录入、数据库的操作等。(4)GPS数据:信号的精度、接收机精度、定位方法、处理算法等。(5)地图:控制点精度,编绘、清绘、制图综合等的精度。(6)地图数字化精度:纸张变形、数字化仪精度、操作员的技能等。,2处理误差:指GIS对空间数据进行处理时产生的误差,包括:(1)几何纠正处理误差(2)坐标变换处理误差(3)几何数据的编辑处理误差(4)属性数据的编辑处理误差(5)空间分析(如多边形叠置等)处理误差(6)图形化简(如数据压缩)处理误差(7)数据格式转换处理误差(8)计算机截断误差处理误差(9)空间内插处理误差(10)矢量-栅格数据的相互转换等处理误差。,3GIS中的误差传播GIS中的误差传播是指对有误差的数据,经过处理生成的GIS产品也存在着误差。误差传播在GIS中可归结为三种方式。(1)代数关系下的误差传播:是指对有误差的数据进行代数运算后,所得结果的误差。(2)逻辑关系下的误差传播:指在GIS中对数据进行逻辑交、并等运算所引起的误差传播,如叠置分析时的误差传播。(3)推理关系下的误差传播:这是指不精确推理所造成的误差。,4.5.3

    注意事项

    本文(第4章+GIS数据采集和数据处理ppt课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开