第4章+GIS数据采集和数据处理ppt课件.ppt
《第4章+GIS数据采集和数据处理ppt课件.ppt》由会员分享,可在线阅读,更多相关《第4章+GIS数据采集和数据处理ppt课件.ppt(88页珍藏版)》请在三一办公上搜索。
1、第4章 GIS数据采集和数据处理,4.1 GIS数据源4.2 地理数据分类和编码4.3 GIS数据采集和输入4.4 GIS数据处理4.5 数据质量和精度控制,空间信息的获取是一个空间信息系统建设的首要任务。一个空间信息系统建设,70以上的工作(费用)将花费在空间信息的获取上面。,4.1 GIS数据源,GIS数据源自地图数据、遥感数据、文本资料、统计资料(电子和非电子数据)、地表实测数据、野外测量或GPS数据、多媒体数据和已有系统的数据等,其中,遥感数据(RS Data)和全球定位系统数据(GPS Data)是GIS的重要数据源。各类数据输入见教材图4.1。,图4.1 数据采集与输入流程图,4.
2、1.1地图数据纸质地图(Hardcopy Map)和图表是GIS的主要数据源,它不仅含有实体的类别和属性,而且含有实体间的空间关系。地图数据主要通过对纸质地图的跟踪数字化和扫描数字化获取。地图数据通常用点(居民点、采样点、高程点、控制点等)、线(河流、道路、构造线等)、面(湖泊、海洋、植被等)及注记(地名注记、高程注记、人口注记等)。地图注记往往是对GIS属性特征的描述,地图符号间的关系对应为目标间的框架关系。地图表达中蕴含着大量的信息内容,需要通过人工判读识别出来,这往往取决于数据采集人员的专业知识、地图判读经验。,4.1.2遥感数据1.遥感影像包括航空相片和卫星影像。航空相片是指安装在飞机
3、上的照相机,沿着预定的航向,按照一定的飞行高度和重叠度摄取的地表影像。与地图比较,航空相片所包含的信息内容丰富、客观真实,它不加选择地、详细地记录了在拍摄时刻被摄地区的地表现象,而不像地图内容是经过了地图制图人员的选取和概括的产物。通过对航空照片的解译和野外调绘,可以获取有关地区生态环境各要素数据。航空相片解译或调绘的成果通常转绘成地图,以地图的形式经数字化输入GIS,成为GIS的一个重要数据源。所以航空照片为显示专题要素提供背景,为地理数据更新提供依据。卫星影像是利用安装在卫星上的传感器接受由地面物体反射或发射的电磁波能量,经模数转换和计算机处理而获得的地表影像数据。如:TM1-7数据、SP
4、OT5数据、IKONOS数据、NOAA数据、MODIS数据等,已成为GIS另一个重要的数据源。,SPOT 5 数据各种融合影像,2.GIS与RS数据关系由于卫星影像以数字形式存在,所以可直接或经过预处理后输入到GIS中,特别是影像处理软件(如:ERDAS或ENVI等)可以根据地理实体在影像上呈现的颜色将它们区别开,并能将辨别出来的地理实体组织成不同的栅格图层,存入地理数据库;由于卫星遥感周期性地重复获取同一地区的影像,利于获取监测、动态数据,利于实时更新地理数据库;通过使用不同波段的卫星影像或将不同波段的影像进行融合处理后,可提取或解译有关的专题要素,用于特定的分析和应用;与其他地理数据源相比
5、,卫星数据获取的费用相对较低,它是目前GIS的重要数据源之一;GIS也可用卫星影像为背景显示专题要素,制作卫星影像地图用于区域分析;利用卫星影像有利于更新数据库的数据。,4.1.3野外测量和全球定位系统(GPS)数据在没有所需的地图或遥感影像数据的情况下,就需要通过野外测量或使用GPS采集数据作为GIS的输入。目的在于确定测量区域内地理实体或地面各点的平面位置和高程。一般野外试验、实地测量等获取的数据可以通过转换直接进入GIS的地理数据库,以便于进行实时的分析和进一步的应用。GPS是一种采用距离交会法的卫星导航定位系统。通过测定测距信号的传播时间来间接测定距离,将无线电信号发射机从地面站搬到卫
6、星上,组成一个卫星导航定位系统,较好地解决覆盖面与定位精度之间的矛盾。GPS由空间部分、控制部分和用户设备三部分组成。近年来,GPS已越来越多地应用于GIS数据的野外采集。,4.1.4其他数据源 其他数据包括:文本资料、统计资料、实测数据、多媒体数据、原有系统的数据等。1.文本资料 文本资料是指各行业、各部门的有关法律文档、行业规范、技术标准、条文条例等,如边界条约等。这些也属于GIS的数据。2.统计资料 各种类型的统计报告、社会调查数据等,是GIS属性数据的重要来源。3.实测数据如野外实地勘测数据、量算数据;台站的观测记录数据;遥测数据。4.多媒体数据 多媒体数据(包括声音、录像等)通常可通
7、过通讯口传入GIS的地理数据库中,目前其主要功能是辅助GIS的分析和查询。,5.原有系统的数据 GIS还可以从其它已建成的信息系统和数据库中获取相应的数据。由于规范化、标准化的推广,不同系统间的数据共享和可交换性越来越强。这样就拓展了数据的可用性,增加了数据的潜在价值。,为整合各种来源的空间数据并进行数据处理,对于数据的分类和编码是很重要的。例如,空间数据的地理参照系(地球的形状、坐标系、高程系)的不同,引起空间数据来源不同时图幅往往不匹配,为此需要将一种投影的数字化数据转换为所需要投影的坐标数据,即进行投影转换。投影转换的方法有:解析变换(正解变换、反解变换)、数值变换、解析和数值变换。目前
8、,大多数GIS软件是采用正解变换法来完成不同投影之间的转换,并直接在GIS软件中提供常见投影之间的转换。,4.2. 地理数据分类和编码,4.2.1地理数据的分类1.分类概念及原则分类是指根据属性或特性将地理实体划分为各种类型,表示同一类型地理实体的数据可以采集在一起,构成一个图层(如图4.2所示)。,图4.2 现实世界和图层划分,GIS是根据地理实体的类型(点或线或面)通过数字化采集和组织地理数据的。分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。拟定分类体系是进行空间数据编码的工作基础,其目的是识别要素和提供要素的地理含义。地理数据的分类体系由两
9、部分组成,即类型名称和描述。类型名称可以根据地理实体的形态或功能而定,但究竟是形态分类还是功能分类,主要取决于地理数据的应用。分类体系的描述部分则是描述各类地理实体的基本功能和性质。例如八大土地类型是“类型名称”,各地类的特性如何则属于“描述”。,注意几个问题:(1)分类体系问题。在一个大型GIS项目中,除非已有一个合适的分类系统,否则需要在深入理解用户需求的基础上,建立一个完整的地理数据分类体系,为地理数据的采集、编码和存储提供标准。(2)分类依据。一个理想的地理数据分类体系应该具有科学性、系统性、完整性和一致性,并能做到简明、充分满足地理数据应用要求。分类过细或过粗都会导致一些潜在的实际问
10、题。(3)使用特征码。在GIS中,分类系统用特征码表示。特征码就是按照信息分类编码的结果,利用一组数字、字符或数字字符的混合来标记不同类别信息的代码。特征码多采用线分类法,它是将空间实体根据一定的分类指标形成若干层次目录,构成一个分层次、逐级展开的分类体系。拟定编码系统。由于分类系统是一个分级系统,因此使用的特征码必须采用统一拟定的编码系统,并符合各行各业邻域的分类分级体系,拟定的特征码要能为多用途数据库提供足够的实用信息,便于计算机处理与信息交换,易于识别和记忆,并使冗余数据最少,代码长度适度。分类与编码主要原则。如: 标准化和通用化; 唯一性和代表性; 清晰性和明确性; 可扩充性和稳定性;
11、 完整性和易读性。,目前,有关地理基础信息数据分类体系的中国国家标准主要包括1992年发表的“国土基础信息数据分类与代码”(标准编号:GB-T13923)、1993年的“1:500,1:1000,1:2000地形图要素分类与代码”(标准编号:GB-T14804)、1995年的“1:5000,1:10000,1:25000,1:500000,1:100000地形图要素分类与代码”(标准编号:GB-T15660)和2001年颁布的“专题地图信息分类与代码”(标准编号:GB-T18317)。不同的专业部门也有相应的分类系统。例如1984年,中国农业区划委员会根据土地的用途、经营特点、利用方式和覆盖特
12、点等因素,将土地划分为八个一级类型、46个二级类型,表4.2描述了其中八个一级类型。,2.分类码和标识码分类码是直接利用信息分类的结果制定的分类代码,用于标记不同类别信息的数据。分类码一般由数字或字符或数字字符混合构成。例如:美国地质调查局(USGS)制订的数字线划图形标准中的7位代码结构,前三位为主码,后四位为子码,如图4.3所示。,图4.3 USGC数字线划图形标准采用的代码结构,例子说明:中国1:100万地形数据库的数据分类体系采用三级结构,即代码由三段码组成:归属码、分类码和标识码。归属码说明数据来源,包括提供数据的单位、系统名称和数据库名称等,它除在不同系统之间交换或转换数据外,一般
13、不使用;分类码说明实体所属的类别,它完全按照国土基础信息数据库分类与代码国家标准;标识码也称识别码,用于标识主要的要素实体,如县级以上居民地及其行政界线、铁路、主要公路、主要河流和湖泊等,用于对实体界线检索,标识码有6位字符和数字混合构成。代码结构和标识码示意,如图4.4所示。,图4.4 代码结构和标识码示意图,进一步说明:代码是给予被处理对象(事物、概念)的符号,是用来代表事物某种属性的一组有序的字母,具体地说,代码可用来代替某一名词、术语,甚至某一个特殊的描述短语。它是人机的共同语言,是进行信息分类、校对、统计和检索的关键。由于当前计算机只能识别以二进制为基础的数字、英文、汉字及少数特殊符
14、号。代码设计就是如何合理地把被处理对象数字化、字符化的过程。代码设计是一项复杂的工作,需要多方面的知识和经验。涉及面广的代码,一般要由几方面人员在标准化部门组织下进行,制定后要正式颁布,统一贯彻。代码是用来表征客观事物的一个或一组有序的符号,它应易于计算机和人识别与处理。代码也简称为“码”。编码就是用数字或字母代表事物。通过编码,建立统一的信息语言,有利于提高通用化水平,使资源共享,达到统一化;有利于采用集中化措施以节约人力,加快处理速度,便于检索。具体地讲,代码具有鉴别功能、分类、排序以及专用含义,4.2.2地理数据的编码地理编码是在数据分类的基础上,以易于计算机和人识别的代码(Code)唯
15、一地标识地理实体的类型,代码由字符(数字或字母或数字和字母混合)构成,由于代码简单,计算机易于准确操作和管理,在地理数据库中,地理实体的类别大多以代码表示。在地理数据采集过程中,要以代码标识地理实体的类型和属性,是GIS设计中最重要的技术步骤 地理编码,它是现实世界与信息世界之间的转换接口(实际就是一个应用程序连接) 。,通用地理编码的基本要求包括: 要素识别(即地方名称、实体类型、地址等); 要素位置(用于唯一地识别实体在地表上的位置); 要求特征(属性); 作用范围描述; 提供地理定义。服务于空间分析的地理编码分为拓扑编码和坐标编码(详见第3章)。根据有关原则设计的代码主要用于控制地理数据
16、数字化采集和输入,用于在地理数据库中系统地表示地理实体以及它们的属性。代码以及相应的描述通常也存储在地理数据库中作为元数数据的一部分,以帮助用户理解、分析、管理和显示地理数据。,4.3 GIS数据采集和输入,地理数据采集主要指实地调查和采样,包括野外考查、GPS定位等。所选择的数据源资料一般要经过预处理(对空间数据分幅、分层和分专题要素)才能借助数字化或其它途径转换成空间数据库可用的数据。空间地理数据无论是来源于数字数据,还是来源于模拟数据,都需要与所使用的GIS软、硬件相兼容。模拟数据,需经过数字化才能输入到GIS中;常用的模拟数据输入方法有:手工数字化、自动数字化(包括扫描)和键盘输入等。
17、计算机虽可阅读和存储数字数据,但输入的数字数据格式与所用的GIS软件不一致时,要经过数据格式转换后才能输录入。GIS数据采集与输入的同时,还实现数据编辑功能。数据录入和编辑就是各图层实体的地物要素按顺序转化为x、y坐标及对应的代码输入到计算机中。,4.3.1建库前准备1资料准备,区域标定一般包括如下几项内容: 基础原始数据的确定(一般只采集存储基础的原始数据,不存储派生的数据,但若使用频率很高,也可作基础数据存储,这就是“数据采集存储原则”); 数据分类项目的确定(即数据分类); 数据标准准确性的确定(即数据编码)。,2进行地理基础的三个统一地理基础的三个统一,即:投影、比例尺、分类分级编码的
18、统一。3软件检查软件功能测试运行和系统调试等检查及其他辅助工作。4硬件检查主机和外设(包括数字化仪、扫描仪、打印机、绘图仪等的设备)等是否正常工作。5其它工作(1)数据的预处理(包括对数据源数据的取舍、增强、分离、证实、加工以及再生产)。(2)建立数据的质量标准和数据管理责任制。(3)数据库入库的组织管理工作。,4.3.2几何图形数据的采集1.数字化方式 常用的有三种:(1)手扶跟踪数字化:手扶跟踪数字化设备要求特定的手扶跟踪数字化仪;除对处理简单图形要素,效率较高外,也适于更新和补充少量内容;输入一般多采用点方式,但也可根据实际情况选用点、流或结合方式 。(2)屏幕数字化:屏幕数字化需要扫描
19、数字化设备以及屏幕数字化软件。使用该软件精度较高、劳动强度较低。(3)扫描数字化:设备要求有一定的扫描设备及配套的栅格编辑和矢量化软件;使用时速度较快、精度较高、劳动强度低;但使用时需规定最低分辨率和采点密度。扫描影像时,应考虑软硬件的承受能力和查询显示速度。对于线划图,扫描后通过栅格_矢量转换软件(如:R2V)处理后,得到矢量数据,可大大提高数字化工作效率。但对原图数据要求较高,所以,一般应需要对比强、线划实在、背景质地光滑的数据,否则转化得到的线划图就会发生断线、歪曲连通性等严重错误。,(1)设置好数字化仪,(2)确定投影方式和坐标系统 地图投影方式和坐标系选择得是否恰当,直接影响地图的精
20、度和使用价值。选择时,主要考虑以下因素: 制图区域的范围、形状和地理位置; 地图的用途、出版方式及其他特殊要求。,数字化一般步骤:,(3)利用数字化软件,屏幕跟踪矢量化一般步骤: (1)准备扫描图像。 (2)栅格图像配准:选择投影和单位、输入控制点以及编辑控制点。 (3)新建数字化图层 (4)屏幕跟踪矢量化地图,图4.5 栅格量化过程,注意:不管采用何方式采集数据,为了适应空间分析,都应注意以下几点:(1)采集精度符合质量控制的要求。(2)采点密度应合理。(3)实体采集要精确(如:点状要素应采集符号的几何中心点或定位点;线状要素应沿中轴线采集;面状要素应采集多边形边界和标识点,边线应严格闭合)
21、。,2.几何图形数据的采集步骤几何图形数据的采集步骤如下。(1)地图数字化前需要对数字化底图进行适当处理,主要包括: 减少图纸变形的影响; 线划要素的分段; 选取控制点。(2)确定数字化路线。在数字化之前一定要设计好数字化所采用的技术路线,这关系到地图数字化的效率。确定数字化路线包括: 选择底图,底图的选取主要考虑底图的精度和要素的繁简; 地图分层与分幅,即对哪些要素数字化,对要数字化的要素进行分层并确定图名;对图幅大的还要涉及对数字化地图的分幅与拼接。,(3)地图数字化过程。是指把传统的纸质地图或其它材料上的地图(模拟信号)转换为计算机可识别的图形数据(数字信号)的过程,以便进一步在计算机中
22、进行存储、分析和输出。(4)地图数字化包括手工数字化、半自动数字化和自动数字化。,手工数字化(Manual Digitizing):是指不借用任何数字化设备对地图进行数字化,即手工读取并录入(键盘输入)地图的地理坐标数。其容易导致位置误差。手工数字化按照空间数据的存储格式的不同分为以下几种:手工矢量数字化:是指直接读取地理实体坐标数据并按一定格式记录下来。具体步骤为:第一,对地理实体编码;第二,量取地理实体的坐标;第三,录入坐标数据;第四,由GIS软件转换成一定格式的矢量数据。手工栅格数字化:是指将图面划分成栅格单元矩阵,按地理实体的类别对栅格单元进行编码,然后依次读取每个栅格单元代码值的数字
23、化方法。一般步骤为:第一,确定栅格单元大小(由网格精度要求而定);第二,准备栅格网(一般用聚酯薄膜透明格网);第三,对栅格单元进行编码;第四,读取栅格单元值;第五,数据录入(由键盘输入格网的行数、列数、网格的边长等)。,手扶数字化仪数字化:指利用手扶数字化仪进行地图数字化。操作需要以下几个基本步骤。第一步 准备数字化原图。先检查原图内容的完整性。例如,查看多边形是否闭合,线划是否连续等;其次在岛屿多边形上标出一个起始顶点,以保证在数字化岛屿多边形时,最后返回到它的起始顶点;接着在原图上选择和标出四个或四个以上的控制点,每个控制点都必须具有已知的实地注标(经、纬度或地图平面直角坐标),通常选择原
24、图的图幅角点,经纬网或公里网格网交点,或在实地坐标已知的显著地物作为控制点。为保证精度,可将原图内容复制或转绘到不变形的聚酯薄膜上。在原图准备好以后,将它固定到数字化台面上。第二步 定义数字化规则。包括确定如何将原图包含的要素划分成若干图层,每一个图层应当包含同一实体类型(点、线或面)或同一主题要素,数字化需按图层进行,即一个图层数字化完毕后,再数字化另一图层的要素。此外,在数字化之前,还应当确定图形选取和概括的规则,以控制地图或地理数据综合的程度。,第三步 数字化控制点。将数字化仪游标上的十字丝交点对准在原图上标识好的控制点,并记录它们的点坐标,然后由键盘输入它们的实地坐标。数字化仪记录的点
25、位坐标是相对于数字化台面坐标原点(台面左下角)的平面直角坐标(以厘米为单位),控制点的实地坐标用于将数字化台面坐标转换成在地面的实际坐标。在数字化仪控制软件接收到控制点的实地和数字化台面坐标以后,它计算出一个转换矩阵,并将这个转换矩阵自动地应用于后续数字化采集的坐标数据,再将它们转换成地面实际坐标,然后输入GIS,以此类推。控制点的数字化必须尽可能地精确,因为它决定了坐标数据转换的精度。第四步 数字化地理实体的几何图形。图形数字化实际上是获取构成点、线或面的所有特征点或顶点的坐标。点状实体数字化为一个点;线状实体数字化为一个有序点集。GIS显示软件将所有点按顺序以直线段相连,形成弧或线段链,点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GIS 数据 采集 数据处理 ppt 课件
链接地址:https://www.31ppt.com/p-1354271.html